Dimensionaal modelleren

Gegevensmodellering in Power BI

Sara Billen

Curriculum Manager at DataCamp

Het Kimball‑model

Het dimensionale model

Boekomslag van The Data Warehouse Toolkit, mede geschreven door Ralph Kimball

Gegevensmodellering in Power BI

Het Kimball‑model

  • Kernbegrippen
    • Feiten: metrics uit een bedrijfsproces
    • Dimensies: context rond een bedrijfsproces
    • Samen vormen ze een sterrenschema
  • Sterrenschema's worden in datawarehouses gebruikt
  • Power BI is geoptimaliseerd voor sterrenschema's

Diagram van een sterrenschema met een feit omringd door vijf dimensies

Gegevensmodellering in Power BI

Feittabellen

  • Bestaat uit
    • Feiten (maten)
      • Metingen of metrics uit je bedrijfsproces
    • Sleutels
      • Gebruikt om relaties te leggen tussen feit- en dimensietabellen
  • Feittabellen zijn lang en smal
    • Veel rijen
    • Minder kolommen

Diagram van een sterrenschema met een feit omringd door vijf dimensies

Gegevensmodellering in Power BI

Feittabellen: een voorbeeld

Tabel Property Sales

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200530 PG20 P2 SA6 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Gegevensmodellering in Power BI

Feittabellen: een voorbeeld

Sleutels: leggen relaties tussen tabellen

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Gegevensmodellering in Power BI

Feittabellen: een voorbeeld

Maten: metrics uit het bedrijfsproces

LenderID StartDateID PropertyID PaymentTypeID SalesPersonID Rent Duration
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1250 12
CO62 20201201 PG16 P3 SA5 3000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5000 12
CO76 20200115 PG11 P2 SA2 2000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Gegevensmodellering in Power BI

Dimensiontabellen

  • Bieden context
    • Wie, wat, wanneer, waar, waarom?
  • Gedeelde businessconcepten
    • Bijv. persoon, medewerker, klant, leverancier
  • Bevatten statische of "langzaam veranderende" data
    • Bijv. naam, geboortedatum, lengte
  • Dimensiontabellen zijn kort en breed
    • Weinig rijen
    • Veel kolommen

Diagram van een sterrenschema met een feit omringd door vijf dimensies

Gegevensmodellering in Power BI

Dimensiontabellen: een voorbeeld

Tabel Salesperson

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Gegevensmodellering in Power BI

Dimensiontabellen: een voorbeeld

Sleutel: legt relatie met feittabel

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ...
Gegevensmodellering in Power BI

Dimensiontabellen: een voorbeeld

Attributen: kenmerken van de dimensie

SalesPersonID FirstName LastName DateOfBirth Salary
SA9 Mary Howe 1990-02-19 24000
SA12 David Ford 1978-03-24 18000
SA5 Ann Beech 1980-11-10 12000
SA6 Julie Lee 1985-06-13 30000
SA9 John White 1965-10-01 9000
... ... ... ... ...
Gegevensmodellering in Power BI

Datamodel voor het sterrenschema Property Sales

  • Dimensies worden in meerdere feiten gebruikt
  • Dimensies koppelen niet aan andere dimensies
Gegevensmodellering in Power BI

De dataset

Feit
  • Establishment Survey: aantal werknemers, aantal bedrijven, ...
Dimensies
  • Industrie: NAICS‑code, branchegroep, subsector, sector
  • Tijd: jaar, decennium, eeuw
  • Leeftijd: leeftijd van vestiging
  • Geografie: land, staat

Foto van een lopende band in een flessenfabriek

Gegevensmodellering in Power BI

Laten we oefenen!

Gegevensmodellering in Power BI

Preparing Video For Download...