Dein erstes Projekt

Einführung in dbt

Mike Metzger

Data Engineer

dbt-Workflow

  1. Projekt erstellen (dbt init)
  2. Konfiguration definieren (profiles.yml)
  3. Modelle / Vorlagen erstellen bzw. verwenden
  4. Modelle instanziieren (dbt run)
  5. Überprüfen / Testen / Fehler beheben
  6. Nach Bedarf wiederholen
Einführung in dbt

dbt run

  • Ausführung bei Modelländerungen
  • Oder wenn der Datenprozess materialisiert werden muss
  • Ausgabe zeigt Details zu Erfolg / Misserfolg der Schritte
  • Materialisiert = Transformationen als Tabellen bzw. Sichten / Views
repl:~$ dbt run
04:52:11  Running with dbt=1.8.4
...
04:52:13  1 of 1 START sql view model main.sales_data ....... [RUN]
04:52:13  1 of 1 OK created sql view model main.sales_data . [OK in 0.12s]  
...
04:52:13  Completed successfully
Einführung in dbt

Tabellen vs. Sichten

Tabellen:

  • Objekte innerhalb einer Datenbank / eines Warehouses, die Daten enthalten
  • Belegen Speicherplatz in der Datenbank
  • Inhalt wird nur bei Änderungen aktualisiert

$$

  • Kann mit dbt erstellt werden ✅

Sichten / Views:

  • Abfragbar wie eine Tabelle; enthalten selbst keine Informationen
  • Meist als SELECT-Abfrage gegen andere Tabelle(n) definiert
  • Inhalt wird bei jeder Abfrage erzeugt

$$

  • Können mit dbt erstellt werden ✅
Einführung in dbt

Probier es aus!

Einführung in dbt

Preparing Video For Download...