Sich langsam verändernde Dimensionen

Konzepte des Data Warehousing

Aaren Stubberfield

Data Scientist

Die Herausforderung

Klassisch

Produkt-ID Beschreibung Kategorie
12345 Tesla-ModelY Elektrofahrzeug

Bild eines weißen Tesla-Y

Kategorie aktualisieren:

  • Aktuell: Elektrofahrzeug
  • Neu: Elektro-Crossover
Konzepte des Data Warehousing

Typ I

  • Wert in Tabelle aktualisieren
  • Der gesamte Verlauf geht verloren

Klassisch

Produkt-ID Beschreibung Kategorie
12345 Tesla-ModelY Elektrofahrzeug

Neu

Produkt-ID Beschreibung Kategorie
12345 Tesla-ModelY Elektro-Crossover
Konzepte des Data Warehousing

Typ II

  • Fügt eine Zeile mit dem aktualisierten Wert hinzu
  • Der Verlauf bleibt erhalten

Klassisch

Produkt-ID Beschreibung Kategorie
12345 Tesla-ModelY Elektrofahrzeug

Neu

Produkt-ID Beschreibung Kategorie StartDate EndDatum
12345 Tesla-ModelY Elektrofahrzeug 01.01.1970 10.03.2022
20053 Tesla-ModelY Elektro-Crossover 11.03.2022 31.12.2050
Konzepte des Data Warehousing

Typ III

  • Hinzufügen einer Spalte zur Dimensionstabelle, um Änderungen zu verfolgen
  • Kann alte und aktuelle Daten zusammen anzeigen
  • Kann Änderungen im Berichtswesen erfordern und Nachverfolgung einschränken

Klassisch

Produkt-ID Beschreibung Kategorie
12345 Tesla-ModelY Elektrofahrzeug

Neu

Produkt-ID Beschreibung Kategorie AlteKategorie
12345 Tesla-ModelY Elektro-Crossover Elektrofahrzeug
Konzepte des Data Warehousing

Moderner Ansatz

  • Versionierung der gesamten Dimensionstabelle
  • Verwendet alte Versionen für alte Berichte
Konzepte des Data Warehousing

Lass uns üben!

Konzepte des Data Warehousing

Preparing Video For Download...