Trabajar con un primer proyecto

Introducción al dbt

Mike Metzger

Data Engineer

Flujo de trabajo de dbt

  1. Crear proyecto (dbt init)
  2. Definir configuración (profiles.yml)
  3. Crear / usar modelos / plantillas
  4. Instanciar modelos (dbt run)
  5. Verificar / Probar / Depurar
  6. Repetir según sea necesario
Introducción al dbt

dbt run

  • Ejecuta cuando cambie un modelo
  • O cuando haya que materializar el proceso de datos
  • La salida detalla el éxito o fallo de cada paso
  • Materializar = transformar en tablas/vistas
repl:~$ dbt run
04:52:11  Running with dbt=1.8.4
...
04:52:13  1 of 1 START sql view model main.sales_data ....... [RUN]
04:52:13  1 of 1 OK created sql view model main.sales_data . [OK in 0.12s]  
...
04:52:13  Completed successfully
Introducción al dbt

Tabla vs. Vista

Tablas:

  • Objetos en la base de datos/warehouse que almacenan datos
  • Ocupan espacio en la base de datos
  • Su contenido solo cambia cuando se actualizan

$$

  • dbt puede crearlas ✅

Vistas:

  • Consultables como una tabla; no almacenan datos
  • Normalmente definidas como un SELECT sobre otra(s) tabla(s)
  • El contenido se genera en cada consulta

$$

  • dbt puede crearlas ✅
Introducción al dbt

¡Vamos a practicar!

Introducción al dbt

Preparing Video For Download...