Dimensões de mudanças lentas

Conceitos de Data Warehousing

Aaren Stubberfield

Data Scientist

O desafio

Original

ProductID Description Category
12345 Tesla-ModelY electric-veh.

imagem de um Tesla-Y branco

Atualizar Category:

  • Atual: electric-veh.
  • Novo: electric-crossover
Conceitos de Data Warehousing

Tipo I

  • Atualiza o valor na tabela
  • Perde todo o histórico

Original

ProductID Description Category
12345 Tesla-ModelY electric-veh.

Novo

ProductID Description Category
12345 Tesla-ModelY electric-crossover
Conceitos de Data Warehousing

Tipo II

  • Adiciona uma linha com o valor atualizado
  • O histórico é mantido

Original

ProductID Description Category
12345 Tesla-ModelY electric-veh.

Novo

ProductID Description Category StartDate EndDate
12345 Tesla-ModelY electric-veh. 1970-01-01 2022-03-10
20053 Tesla-ModelY electric-crossover 2022-03-11 2050-12-31
Conceitos de Data Warehousing

Tipo III

  • Adiciona coluna na dimensão para rastrear mudanças
  • Permite ver dados passados e atuais juntos
  • Pode exigir relatórios de mudanças e rastreamento limitado

Original

ProductID Description Category
12345 Tesla-ModelY electric-veh.

Novo

ProductID Description Category PastCategory
12345 Tesla-ModelY electric-crossover electric-veh.
Conceitos de Data Warehousing

Abordagem moderna

  • Tira um snapshot da dimensão inteira
  • Usa snapshots históricos para relatórios históricos
Conceitos de Data Warehousing

Vamos praticar!

Conceitos de Data Warehousing

Preparing Video For Download...