Qu’est-ce qu’un modèle dbt ?

Introduction à dbt

Mike Metzger

Data Engineer

Qu’est-ce qu’un modèle de données ?

  • Conceptuel, avec des définitions variables selon le contexte
  • Représente la signification logique des données
  • Décrit les relations entre les données et leurs composants
  • Aide les utilisateurs à collaborer
Introduction à dbt

Qu’est-ce qu’un modèle de données ?

  • Conceptuel, avec des définitions variables selon le contexte
  • Représente la signification logique des données
  • Décrit les relations entre les données et leurs composants
  • Aide les utilisateurs à collaborer
Espèce Nb de pattes Venimeux
Guépard 4 Non
Canard 2 Non
Ornithorynque 4 Oui
Crotale 0 Oui
Introduction à dbt

Qu’est-ce qu’un modèle dans dbt ?

  • Représente les différentes transformations
  • Généralement écrit en SQL
    • Les versions récentes peuvent utiliser Python
  • Souvent une requête SELECT
  • Chaque modèle est un fichier texte avec l’extension .sql
Introduction à dbt

Modèle dbt simple

  1. Créer un répertoire dans models
  2. Créer un fichier .sql dans ce répertoire
  3. Ajouter l’instruction SQL dans ce fichier
  4. Exécuter dbt run pour matérialiser le modèle
bash> mkdir models/order
bash> touch models/order/customer_orders.sql
select first_name, 
       last_name,
       shipping_address,
       item_quantity
from source_table

bash> dbt run

Introduction à dbt

Lecture depuis Parquet

  • Parquet ?
    • Format de fichier binaire colonnaire
    • DuckDB lit les fichiers Parquet directement
    • read_parquet
      • SELECT * FROM read_parquet('filename.parquet')
    • Ou simplement le nom de fichier entre guillemets simples
      • SELECT * FROM 'filename.parquet'
Introduction à dbt

Passons à la pratique !

Introduction à dbt

Preparing Video For Download...