Trabalhando no primeiro projeto

Introdução ao dbt

Mike Metzger

Data Engineer

Workflow do dbt

  1. Criar projeto (dbt init)
  2. Definir config (profiles.yml)
  3. Criar / usar modelos / templates
  4. Instanciar modelos (dbt run)
  5. Verificar / Testar / Depurar
  6. Repetir quando preciso
Introdução ao dbt

dbt run

  • Rodar quando houver mudanças no modelo
  • Ou quando o processo precisar ser materializado
  • A saída mostra detalhes de sucesso ou falha nas etapas
  • Materializado = transformações viram tabelas / views
repl:~$ dbt run
04:52:11  Running with dbt=1.8.4
...
04:52:13  1 of 1 START sql view model main.sales_data ....... [RUN]
04:52:13  1 of 1 OK created sql view model main.sales_data . [OK in 0.12s]  
...
04:52:13  Completed successfully
Introdução ao dbt

Tabela vs View

Tabelas:

  • Objetos no banco/warehouse que guardam dados
  • Ocupam espaço no banco
  • Conteúdo só muda quando atualizado

$$

  • Podem ser criadas pelo dbt ✅

Views:

  • Consultáveis como tabela; não armazenam dados
  • Geralmente definidas por um SELECT em outra(s) tabela(s)
  • Conteúdo gerado a cada consulta

$$

  • Podem ser criadas pelo dbt ✅
Introdução ao dbt

Vamos praticar!

Introdução ao dbt

Preparing Video For Download...