Modelagem dimensional

Modelagem de dados no Power BI

Sara Billen

Curriculum Manager at DataCamp

O Modelo Kimball

O modelo dimensional

Capa do livro The Data Warehouse Toolkit, coescrito por Ralph Kimball

Modelagem de dados no Power BI

O Modelo Kimball

  • Conceitos-chave
    • Fatos: métricas de um processo de negócio
    • Dimensões: contexto de um processo de negócio
    • Juntos formam um esquema em estrela
  • Esquemas em estrela são usados em data warehouses
  • O Power BI é otimizado para esquemas em estrela

Diagrama de um esquema em estrela com um fato cercado por cinco dimensões

Modelagem de dados no Power BI

Tabelas fato

  • Composta por
    • Fatos (métricas)
      • Medidas ou métricas do seu processo de negócio
    • Chaves
      • Usadas para criar relações entre tabelas fato e dimensão
  • Tabelas fato são longas e estreitas
    • Muitas linhas
    • Poucas colunas

Diagrama de um esquema em estrela com um fato cercado por cinco dimensões

Modelagem de dados no Power BI

Tabelas fato: exemplo

Tabela Property Sales

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200530 PG20 P2 SA6 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modelagem de dados no Power BI

Tabelas fato: exemplo

Chaves: criam relações entre tabelas

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modelagem de dados no Power BI

Tabelas fato: exemplo

Métricas: medidas do processo de negócio

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Modelagem de dados no Power BI

Tabelas dimensão

  • Dão contexto
    • Quem, o quê, quando, onde, por quê?
  • Conceitos de negócio comuns
    • Ex.: pessoa, funcionário, cliente, fornecedor
  • Trazem dados estáticos ou "lentos"
    • Ex.: nome, data de nascimento, altura
  • Tabelas dimensão são curtas e largas
    • Poucas linhas
    • Muitas colunas

Diagrama de um esquema em estrela com um fato cercado por cinco dimensões

Modelagem de dados no Power BI

Tabelas dimensão: exemplo

Tabela de vendedores

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modelagem de dados no Power BI

Tabelas dimensão: exemplo

Chave: cria relação com a tabela fato

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Modelagem de dados no Power BI

Tabelas dimensão: exemplo

Atributos: características da dimensão

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ... ... ...
Modelagem de dados no Power BI

Modelo de dados do esquema em estrela de Vendas de Imóveis

  • Dimensões são usadas em vários fatos
  • Dimensões não se ligam a outras dimensões
Modelagem de dados no Power BI

O conjunto de dados

Fato
  • Establishment Survey: número de empregados, número de empresas, ...
Dimensões
  • Indústria: código NAICS, grupo, subsetor, setor
  • Tempo: ano, década, século
  • Idade: idade do estabelecimento
  • Geografia: país, estado

Foto de uma esteira em uma fábrica de garrafas

Modelagem de dados no Power BI

Vamos praticar!

Modelagem de dados no Power BI

Preparing Video For Download...