Dimensionale Modellierung

Datenmodellierung in Power BI

Sara Billen

Curriculum Manager at DataCamp

Das Kimball-Modell

Das Dimensionsmodell

Buchcover von „The Data Warehouse Toolkit“, das Ralph Kimball mitgeschrieben hat

Datenmodellierung in Power BI

Das Kimball-Modell

  • Schlüsselkonzepte
    • Fakten: Kennzahlen aus einem Geschäftsprozess
    • Dimensionen: der Kontext, in dem ein Geschäftsprozess stattfindet
    • Kombination aus beiden ergibt ein Star-Schema
  • Star-Schemata werden in Data Warehouses verwendet.
  • Power BI ist für Star-Schemata optimiert.

Diagramm eines Star-Schemas mit einer Tatsache, die von fünf Dimensionen umgeben ist

Datenmodellierung in Power BI

Faktentabellen

  • Besteht aus
    • Fakten (measures)
      • Messungen oder Kennzahlen aus deinem Geschäftsprozess
    • Schlüssel
      • Werden benutzt, um Beziehungen zwischen Fakten- und Dimensionstabellen herzustellen.
  • Faktentabellen sind lang und schmal.
    • Viele Zeilen
    • Weniger Spalten

Diagramm eines Star-Schemas mit einer Tatsache, die von fünf Dimensionen umgeben ist

Datenmodellierung in Power BI

Faktentabellen: ein Beispiel

Immobilienverkauf-Tabelle

KreditorID StartDatumID GrundstueckID ZahlungsartID VerkaeuferID Miete Dauer
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1.250 12
CO62 20201201 PG16 P3 SA5 3.000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200530 PG20 P2 SA6 5.000 12
CO76 20200115 PG11 P2 SA2 2.000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Datenmodellierung in Power BI

Faktentabellen: ein Beispiel

Schlüssel: Stellen Beziehungen zwischen Tabellen her.

KreditorID StartDatumID GrundstueckID ZahlungsartID VerkaeuferID Miete Dauer
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1.250 12
CO62 20201201 PG16 P3 SA5 3.000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5.000 12
CO76 20200115 PG11 P2 SA2 2.000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Datenmodellierung in Power BI

Faktentabellen: ein Beispiel

Measures / Messwerte: Kennzahlen aus dem Geschäftsprozess

KreditorID StartDatumID GrundstueckID ZahlungsartID VerkaeuferID Miete Dauer
CO76 20200624 PG14 P2 SA9 750 24
CO56 20200907 PG4 P4 SA12 1.250 12
CO62 20201201 PG16 P3 SA5 3.000 36
CO43 20200201 PG6 P3 SA6 500 24
CO76 20200430 PG20 P2 SA9 5.000 12
CO76 20200115 PG11 P2 SA2 2.000 24
CO32 20201201 PG15 P2 SA9 450 36
... ... ... ... ... ... ...
Datenmodellierung in Power BI

Dimensionstabellen

  • Kontext bereitstellen
    • Wer, was, wann, wo, warum?
  • Gängige Bestandteile eines Geschäftskonzepts
    • Z. B.: Person, Mitarbeiter, Kunde, Lieferant
  • Enthält statische oder „sich langsam ändernde“ Daten
    • Z. B.: Name, Geburtsdatum, Größe
  • Dimensionstabellen sind kurz und breit.
    • Wenige Zeilen
    • Viele Spalten

Diagramm eines Star-Schemas mit einer Tatsache, die von fünf Dimensionen umgeben ist

Datenmodellierung in Power BI

Dimensionstabellen: ein Beispiel

Verkaufsmitarbeiter-Tabelle

VerkaeuferID Vorname Nachname Geburtsdatum Gehalt
SA9 Maria Howe 1990-02-19 24.000
SA12 David Ford 1978-03-24 18.000
SA5 Ann Buche 1980-11-10 12.000
SA6 Julie Lee 1985-06-13 30.000
SA9 John Weiß 1965-10-01 9.000
... ... ...
Datenmodellierung in Power BI

Dimensionstabellen: ein Beispiel

Schlüssel: stellen die Beziehung zur Faktentabelle her

VerkaeuferID Vorname Nachname Geburtsdatum Gehalt
SA9 Maria Howe 1990-02-19 24.000
SA12 David Ford 1978-03-24 18.000
SA5 Ann Buche 1980-11-10 12.000
SA6 Julie Lee 1985-06-13 30.000
SA9 John Weiß 1965-10-01 9.000
... ... ...
Datenmodellierung in Power BI

Dimensionstabellen: ein Beispiel

Attribute: verschiedene Eigenschaften der Dimension

VerkaeuferID Vorname Nachname Geburtsdatum Gehalt
SA9 Maria Howe 1990-02-19 24.000
SA12 David Ford 1978-03-24 18.000
SA5 Ann Buche 1980-11-10 12.000
SA6 Julie Lee 1985-06-13 30.000
SA9 John Weiß 1965-10-01 9.000
... ... ... ... ...
Datenmodellierung in Power BI

Datenmodell für das Star-Schema „Immobilienverkauf“

  • Dimensionen werden für mehreren Fakten verwendet.
  • Dimensionen sind nicht mit anderen Dimensionen verknüpft.
Datenmodellierung in Power BI

Der Datensatz

Fakt
  • Unternehmensbefragung: Anzahl der Mitarbeitenden, Anzahl der Firmen, ...
Dimensionen
  • Branche: NAICS-Code, Branchengruppe, Teilsektor, Sektor
  • Zeit: Jahr, Jahrzehnt, Jahrhundert
  • Alter: Gründungsalter
  • Geografie: Land, Bundesland

Foto von einem Förderband in einer Flaschenfabrik

Datenmodellierung in Power BI

Lass uns üben!

Datenmodellierung in Power BI

Preparing Video For Download...