Was ist ein dbt-Modell?

Einführung in dbt

Mike Metzger

Data Engineer

Was ist ein Datenmodell?

  • Konzeptionell, mit unterschiedlichen Definitionen je nach Kontext
  • Repräsentiert die logische Bedeutung von Daten
  • Zusammenhang zwischen Daten und ihren Komponenten
  • Hilft Nutzern bei der Zusammenarbeit
Einführung in dbt

Was ist ein Datenmodell?

  • Konzeptionell, mit unterschiedlichen Definitionen je nach Kontext
  • Repräsentiert die logische Bedeutung von Daten
  • Zusammenhang zwischen Daten und ihren Komponenten
  • Hilft Nutzern bei der Zusammenarbeit
Art # Beine Giftig
Gepard 4 Nein
Ente 2 Nein
Schnabeltier 4 Ja
Klapperschlange 0 Ja
Einführung in dbt

Was ist ein Modell in dbt?

  • Repräsentiert die verschiedenen Transformationen
  • Typischerweise in SQL geschrieben
    • Neuere Versionen können Python verwenden
  • Meistens eine SELECT-Abfrage
  • Jedes Modell wird durch eine Textdatei mit der Dateiendung .sql dargestellt
Einführung in dbt

Einfaches dbt-Modell

  1. Order im Verzeichnis models erstellen
  2. .sql-Datei in diesem Verzeichnis anlegen
  3. SQL-Anweisung zur neu erstellten Datei hinzufügen
  4. dbt run aus, um das Modell zu materialisieren
bash> mkdir models/order
bash> touch models/order/customer_orders.sql
select first_name, 
       last_name,
       shipping_address,
       item_quantity
from source_table

bash> dbt run

Einführung in dbt

Lesen aus Parquet-Dateien

  • Parquet?
    • Spaltenorientiertes Binärdateiformat
    • DuckDB kann Parquet-Dateien direkt lesen
    • read_parquet
      • SELECT * FROM read_parquet('filename.parquet')
    • Oder einfach den Dateinamen in einfachen Anführungszeichen
      • SELECT * FROM 'filename.parquet'
Einführung in dbt

Probier es aus!

Einführung in dbt

Preparing Video For Download...