¿Qué es un modelo de dbt?

Introducción al dbt

Mike Metzger

Data Engineer

¿Qué es un modelo de datos?

  • Conceptual, con definiciones que varían según el contexto
  • Representa el significado lógico de los datos
  • Cómo se relacionan los datos y sus componentes
  • Ayuda a las personas a colaborar
Introducción al dbt

¿Qué es un modelo de datos?

  • Conceptual, con definiciones que varían según el contexto
  • Representa el significado lógico de los datos
  • Cómo se relacionan los datos y sus componentes
  • Ayuda a las personas a colaborar
Especie # de patas Venenoso
Guepardo 4 No
Pato 2 No
Ornitorrinco 4
Serpiente de cascabel 0
Introducción al dbt

¿Qué es un modelo en dbt?

  • Representa las distintas transformaciones
  • Normalmente escrito en SQL
    • Versiones recientes pueden usar Python
  • Suele ser una consulta SELECT
  • Cada modelo es un archivo de texto con extensión .sql
Introducción al dbt

Modelo dbt simple

  1. Crea un directorio en models
  2. Crea un archivo .sql en ese directorio
  3. Añade la sentencia SQL al archivo creado
  4. Ejecuta dbt run para materializar el modelo
bash> mkdir models/order
bash> touch models/order/customer_orders.sql
select first_name, 
       last_name,
       shipping_address,
       item_quantity
from source_table

bash> dbt run

Introducción al dbt

Leer desde Parquet

  • ¿Parquet?
    • Formato de archivo binario columnar
    • DuckDB puede leer Parquet directamente
    • read_parquet
      • SELECT * FROM read_parquet('filename.parquet')
    • O simplemente el nombre del archivo entre comillas simples
      • SELECT * FROM 'filename.parquet'
Introducción al dbt

¡Vamos a practicar!

Introducción al dbt

Preparing Video For Download...