Aset utama Databricks SQL

Pengantar Databricks SQL

Kevin Barlow

Data Manager

Analogi yang membantu

Sebuah pohon terdiri dari banyak komponen yang membentuk satu kesatuan

GIF Sistem Pohon

Di Databricks SQL, berbagai komponen bergabung menjadi solusi gudang data

Aset Databricks SQL

Pengantar Databricks SQL

Kueri

  • "Unit" dasar analisis di Databricks SQL
  • Menjalankan kode SQL pada compute
  • Menggunakan standar ANSI SQL
  • Memproses data dari:
    • Unity Catalog
    • Tabel Delta
    • File data lake
    • Stream data
SELECT
    orderdate AS Date,
    orderpriority AS Priority
    sum(totalprice) AS TotalPrice
FROM sfdc.sales.orders
GROUP BY
    1, 2
ORDER BY
    1, 2
Pengantar Databricks SQL

SQL Warehouse

  • Kluster komputasi khusus untuk SQL
  • Optimalisasi (mis. Photon)
  • Administrasi lebih sederhana
  • Skala mudah
  • Kueri dan alat BI

GIF SQL Warehouse

Pengantar Databricks SQL

Tabel vs. view

Tabel

  • Perwujudan fisik dari dataset
  • Ditulis dalam format Delta
  • Dapat dibaca dan diakses di luar pipeline data
  • Dapat mengoptimalkan tata letak data (partisi, dll.)

Tabel di Object Storage

Pengantar Databricks SQL

Tabel vs. view

View

  • Representasi virtual hasil kueri di Unity Catalog
  • Kinerja cepat untuk pembacaan data
  • Bagus untuk menyederhanakan kueri lanjutan
    • Kueri sumber punya banyak join, filter, dll.
  • Pemrosesan data inkremental tersedia

Diagram View

Pengantar Databricks SQL

Visualisasi dan dasbor

Visualisasi

  • Representasi visual dari hasil kueri
  • Dibuat dari satu kueri

Mengonfigurasi Visualisasi

Dasbor

  • Kumpulan beberapa visualisasi
  • Lintas banyak dataset / hasil kueri

Contoh dasbor

Pengantar Databricks SQL

Ayo berlatih!

Pengantar Databricks SQL

Preparing Video For Download...