Asset chiave di Databricks SQL

Introduzione a Databricks SQL

Kevin Barlow

Data Manager

Un’analogia utile

Un albero ha molte componenti, che insieme formano l’intero organismo

GIF sistema albero

In Databricks SQL, diversi componenti si combinano in una soluzione di data warehouse

Asset Databricks SQL

Introduzione a Databricks SQL

Query

  • La “unità” base di analisi in Databricks SQL
  • Esegue SQL sul compute
  • Usa lo standard ANSI SQL
  • Elabora dati da:
    • Unity Catalog
    • Tabelle Delta
    • File nel data lake
    • Stream di dati
SELECT
    orderdate AS Date,
    orderpriority AS Priority
    sum(totalprice) AS TotalPrice
FROM sfdc.sales.orders
GROUP BY
    1, 2
ORDER BY
    1, 2
Introduzione a Databricks SQL

SQL Warehouse

  • Cluster di compute dedicato a SQL
  • Ottimizzazioni (es. Photon)
  • Amministrazione più semplice
  • Scalabilità facile
  • Query e strumenti BI

GIF SQL Warehouse

Introduzione a Databricks SQL

Tabelle vs. viste

Tabelle

  • Manifestazioni fisiche dei dataset
  • Scritte in formato Delta
  • Leggibili e accessibili fuori dalla pipeline dati
  • Possibile ottimizzare il layout (partizionamento, ecc.)

Tabella nello storage oggetti

Introduzione a Databricks SQL

Tabelle vs. viste

Viste

  • Rappresentazioni virtuali dei risultati di query in Unity Catalog
  • Lettura veloce
  • Ottime per semplificare le query a valle
    • La query sorgente ha molte join, filtri, ecc.
  • Disponibile l’elaborazione incrementale

Diagramma vista

Introduzione a Databricks SQL

Visualizzazioni e dashboard

Visualizzazioni

  • Rappresentazioni grafiche del risultato di una query
  • Create rispetto a una singola query

Configurare visualizzazioni

Dashboard

  • Raccolta di più visualizzazioni
  • Su più dataset / risultati di query

Dashboard di esempio

Introduzione a Databricks SQL

Passiamo alla pratica !

Introduzione a Databricks SQL

Preparing Video For Download...