Veri Zekası Platformu - Veri

Databricks'e Giriş

Kevin Barlow

Data Analytics Practitioner

Kurumlar veri yönetimini neden önemser?

Koruma ve güvenlik

Veri Güvenliği

Veriye güven

Güvenilir Analitik

Databricks'e Giriş

Veri türleri

Yapılandırılmış
  • En yaygın ve iyi anlaşılan
  • Tipik satırlar ve sütunlar
  • Örnekler:
    • veritabanı tabloları
    • .csv
    • Parquet
    • Delta
id ad meslek konum
1 Kevin Veri Bilimci California
2 Tom Mimar Arizona
3 Sally Avukat Texas
4 Tina Cerrah Florida
5 Joe Mühendis New York
Databricks'e Giriş

Veri türleri

Yarı yapılandırılmış
  • Web tabanlı cihazlarda yaygın
  • Biraz yapı vardır, içerik daha esnektir
  • Örnekler:
    • JSON
    • XML
    • HTML
{
  "people": [{
      "id": 1,
      "name": "Kevin",
      "occupation": "Data Scientist",
      "location": "California"},
    {
      "id": 2,
      "name": "Tom",
      "occupation": "Architect",
      "location": "Arizona"}]
}
Databricks'e Giriş

Veri türleri

Yapılandırılmamış
  • Akıllı cihazlar, kameralar vb. ile yaygın
  • Az yapı, bilgi açısından zengin
  • Örnekler:
    • JPEG
    • PNG
    • MP4
    • PDF
    • DOC

Yapılandırılmamış Veri Diyagramı

Databricks'e Giriş

Delta

delta.io

  • Açık kaynaklı depolama biçimi
  • Parquet tablolarının koleksiyonu
  • JSON işlem günlüğü
  • Tam ACID uyumlu
  • Batch ve streaming veri kümeleri

Delta Lake

Databricks'e Giriş

Unity Catalog

Unity Catalog Veri Modeli

1 https://docs.databricks.com/en/data-governance/unity-catalog/index.html#the-unity-catalog-object-model
Databricks'e Giriş

Unity Catalog

Unity Catalog Veri Modeli

GRANT, SHOW, REVOKE, USE ...

Databricks'e Giriş

Catalog Explorer

  • Tüm veri varlıklarını keşfetmek için tek yer
  • Veriyi keşfetmek için arayüz
  • Unity Catalog izinlerini yönetin
  • Veri soyunu ve ilgili varlıkları görüntüleyin

Catalog Explorer Ekran Görüntüsü

Databricks'e Giriş

Hadi pratik yapalım!

Databricks'e Giriş

Preparing Video For Download...