Veri Zekâsı Platformu - İşleme

Databricks'e Giriş

Kevin Barlow

Data Practitioner

Kurumlar neden hesaplamayı önemser?

Tek dişli

Dişli sistemi

Databricks'e Giriş

Apache Spark

  • Databricks kurucuları tarafından oluşturuldu
  • Açık kaynak çerçeve
  • Son derece verimli dağıtık hesaplama
  • Python, SQL, Scala, R için API'ler
  • Tüm kullanım durumları için uygundur:
    • veri mühendisliğinden makine öğrenimi ve iş zekâsına

DataCamp'teki bazı Apache Spark kurslarına göz atın!

Apache Spark Logosu

Databricks'e Giriş

Küme Türleri

Klasik (Classic)

  • Hesaplama kaynakları (sanal makineler) İşleme Düzlemi'nde oluşturulur
  • Databricks bulutunuza yapılandırma sağlar
  • Artıları: hesaplama ve güvenlik kendi ortamınızda, mevcut işlem havuzlarını kullanma vb.
  • Eksileri: yavaş başlatma süresi

Databricks Denetim Düzlemi

Databricks'e Giriş

Küme Türleri

Sunucusuz (Serverless)

  • Hesaplama kaynakları (sanal makineler) Denetim Düzlemi'nde oluşturulur
  • Databricks kullanıcılarınıza erişim sağlar
  • Artıları: Hızlı başlatma, en yeni özellikler, en yüksek performans, Databricks zamanla performansı artırır
  • Eksileri(?): hesaplama sizin ortamınızda değildir

Sunucusuz Mimari

Databricks'e Giriş

Tek düğüm vs. Çok düğüm

Tek düğüm (Single-node)

  • Yalnızca bir Sürücü Düğümü olan küme
  • Spark yine çalıştırılabilir
  • Tek düğümlü çerçeveler de çalıştırılabilir (örn. pandas)
  • Küçük veri kümeleri için idealdir

Tek düğümlü küme

Çok düğüm (Multi-node)

  • Bir Sürücü Düğümü ve bir veya daha fazla İşçi Düğümü olan küme
  • Spark işi birden çok düğüme dağıtabilir
  • Büyük veri kümeleri için idealdir

Çok düğümlü küme

Databricks'e Giriş

Databricks Runtime

  • Her Databricks kümesine kurulu
    • Apache Spark'ın optimize edilmiş sürümü
    • Daha hızlı SQL sorguları için Photon
    • Yaygın kütüphaneler (örn. pandas, dplyr, sci-kit learn)
    • Databricks hizmetlerine bağlanma mantığı

Genel öneri: Runtime'ın en güncel Uzun Vadeli Destek (LTS) sürümünü kullanın

Databricks Runtime yüklü küme

Databricks'e Giriş

Hadi pratik yapalım!

Databricks'e Giriş

Preparing Video For Download...