Crear un proyecto de dbt

Introducción al dbt

Mike Metzger

Data Engineer

¿Qué es un proyecto de dbt?

  • Incluye componentes para trabajar con datos en dbt

    • Configuración del proyecto
    • Orígenes y destinos de datos
    • Consultas SQL
    • Plantillas
    • Documentación
  • Implementado como una estructura de carpetas

estructura de carpetas de dbt

Introducción al dbt

Cómo crear un proyecto nuevo

  • Usa el comando dbt init
    • Pide el nombre del proyecto
    • Pide el tipo de base de datos / data warehouse
  • Se puede abreviar con dbt init <projectname>
  • Crea la carpeta raíz y toda la estructura necesaria
repl:~/workspace$ dbt init
16:38:37  Running with dbt=1.8.4
Enter a name for your project (letters, digits, underscore): test_project
Which database would you like to use? [1] duckdb
Enter a number: 1
...
Introducción al dbt

Definir la configuración con perfiles de proyecto

  • Un perfil representa un escenario de despliegue
    • Desarrollo
    • Staging / Pruebas
    • Producción
  • Un proyecto de dbt puede tener varios perfiles
  • Definidos en el archivo profiles.yml
marketing_campaign_results:
  outputs:
    dev:
      type: duckdb
      path: dbt.duckdb
    prod:
      type: snowflake
      ...
  target: dev
Introducción al dbt

YAML

  • Yet Another Markup Language
  • Archivo de texto donde importa la indentación (como Python)
  • Usado para configuración en muchos desarrollos
  • Las reglas pueden ser complicadas; alinea como en los ejemplos
marketing_campaign_results:
  outputs:
    dev:
      type: duckdb
      path: dbt.duckdb
    prod:
      type: snowflake
      ...
  target: dev
Introducción al dbt

DuckDB

  • Base de datos open-source y serverless
    • Similar a sqlite
  • Diseñada para analítica
  • Vectorizada (o sea, MUY RÁPIDA)
  • Fácil de usar

logo de duckdb

Introducción al dbt

¡Vamos a practicar!

Introducción al dbt

Preparing Video For Download...