Introductie tot starschema’s

Gegevens transformeren en analyseren met Microsoft Fabric

Luis Silva

Solution Architect - Data & AI

Basics van dimensioneel modelleren

  • Een dimensionaal model is een datastructuur geoptimaliseerd voor datawarehousing en analyse
  • Het modelleert bedrijfsgebeurtenissen
  • Gebeurtenissen hebben data en context
Gegevens transformeren en analyseren met Microsoft Fabric

Basics van dimensioneel modelleren

Gebeurtenis: verkoop van een product in een winkel.

Afbeelding van een kassabon

Gegevens transformeren en analyseren met Microsoft Fabric

Basics van dimensioneel modelleren

Gebeurtenis: verkoop van een product in een winkel.

  • Numerieke data:
    • Aantal verkochte eenheden
    • Verkoopprijs

Afbeelding van een kassabon met markering van numerieke data: Aantal en Verkoopprijs

Gegevens transformeren en analyseren met Microsoft Fabric

Basics van dimensioneel modelleren

Gebeurtenis: verkoop van een product in een winkel.

  • Meetbare numerieke data:
    • Aantal verkochte eenheden
    • Verkoopprijs
  • Context bij de data:
    • Verkocht product

Afbeelding van een kassabon met markering van numerieke data: Aantal en Verkoopprijs. Ook markering van context: waar, wanneer, en welk product is verkocht

Gegevens transformeren en analyseren met Microsoft Fabric

Gebeurtenisdata opslaan in tabellen

Diagram dat laat zien hoe gegevens op de kassabon zijn te koppelen aan rijen in een salesordertabel

Gegevens transformeren en analyseren met Microsoft Fabric

Gebeurtenisdata opslaan in tabellen

Feittabel met alle regels van de voorbeeldbon

  • Feittabel: bevat alle transacties.
Gegevens transformeren en analyseren met Microsoft Fabric

Gebeurtenisdata opslaan in tabellen

Feittabel met alle regels van de voorbeeldbon, met markering van kolommen voor dimensies: Winkel, Besteldatum, Besteltijd, Verkoper, Klant, Product

  • Feittabel: bevat alle transacties.
  • Dimensies: context van de transactie (wanneer, waar, wat, wie).
Gegevens transformeren en analyseren met Microsoft Fabric

Gebeurtenisdata opslaan in tabellen

Feittabel met alle regels van de voorbeeldbon, met markering van kolommen voor metingen: Verkochte eenheden, Verkoopprijs

  • Feittabel: bevat alle transacties.
  • Dimensies: context van de transactie (wanneer, waar, wat, wie).
  • Metrieken: numerieke data (hoeveel).
Gegevens transformeren en analyseren met Microsoft Fabric

Gebeurtenisdata opslaan in tabellen

Feittabel met alle regels van de voorbeeldbon, met markering van de extra attribuutkolom: Bestelnummer

  • Feittabel: bevat alle transacties.
  • Dimensies: context van de transactie (wanneer, waar, wat, wie).
  • Metrieken: numerieke data (hoeveel).
  • Attributen: extra info over de transactie.
Gegevens transformeren en analyseren met Microsoft Fabric

Normalisatie

Feittabel met markering van de kolom Winkel met de winkelnaam per record

Feittabel met één dimensietabel; de kolom Winkel in de feittabel bevat nu alleen codes, de namen staan in een aparte dimensietabel

Gegevens transformeren en analyseren met Microsoft Fabric

Feittabellen + dimensietabellen

Feittabel met dimensies

Gegevens transformeren en analyseren met Microsoft Fabric

Starschema

Voorbeeld van een starschema

Gegevens transformeren en analyseren met Microsoft Fabric

Snowflakeschema

Voorbeeld van een snowflakeschema

Gegevens transformeren en analyseren met Microsoft Fabric

Snowflakeschema

Voorbeeld van een snowflakeschema

Gegevens transformeren en analyseren met Microsoft Fabric

Snowflakeschema

Voorbeeld van een snowflakeschema

Gegevens transformeren en analyseren met Microsoft Fabric

Starschema vs. snowflakeschema

Belangrijkste verschillen

Onderdeel Starschema Snowflakeschema
Opslag Meer opslag nodig Minder opslag nodig
Normalisatie Gedenormaliseerd (één tabel per dimensie) Genormaliseerd (meerdere tabellen per dimensie)
Modelcomplexiteit Lager Hoger
Query-prestaties Minder JOINs nodig, dus sneller Meer JOINs nodig, dus trager

 

Kies het model dat het beste past. Meestal heeft het starschema de voorkeur: eenvoudiger en sneller.

Gegevens transformeren en analyseren met Microsoft Fabric

Laten we oefenen!

Gegevens transformeren en analyseren met Microsoft Fabric

Preparing Video For Download...