Zeilen- vs. spaltenorientierter Speicher

Konzepte des Data Warehousing

Aaren Stubberfield

Data Scientist

Warum ist das wichtig?

  • Abfragen für mehr Geschwindigkeit optimieren
  • Das spaltenorientierte Speicherformat für Tabellen in Data Warehouses eignet sich am besten für analytische Workloads.
Konzepte des Data Warehousing

Grundlagen der Datenspeicherung auf Computern

  • Computer speichern Daten in Blöcken.
  • Liest die benötigten Blöcke beim Abrufen von Daten.
  • Das lesen weniger Blöcke beschleunigt den ganzen Prozess.

Symbolisches Bild einer Festplatte mit mehreren Speicherblöcken

Konzepte des Data Warehousing

Beispiel für eine Gesundheitsdatentabelle

  • CDC (Zentren für Krankheitskontrolle und Prävention)
  • Influenza-Infektionsdaten nach Altersgruppen über mehrere Saisons, sowie Hospitalisierungsrate (H-Rate)
Saison Alter H-Rate
2019 0–17 13,9 %
2019 18–49 22,5 %
2019 50+ 63,7 %
2020 0–17 3,9 %
2020 18–49 18,1 %
2020 50+ 78 %
2021 0–17 15,6 %
2021 18–49 23,3 %
2021 50+ 61,1 %
Konzepte des Data Warehousing

Beispiel für zeilenorientierten Speicher

Saison Alter H-Rate
2019 0–17 13,9 %
2019 18–49 22,5 %
2019 50+ 63,7 %
2020 0–17 3,9 %
2020 18–49 18,1 %
2020 50+ 78 %
2021 0–17 15,6 %
2021 18–49 23,3 %
2021 50+ 61,1 %

Symbolisches Bild einer Festplatte mit mehreren Speicherblöcken, wobei in jedem Block eine Zeile gespeichert ist

Konzepte des Data Warehousing

Beispiel für eine spaltenorientierte Speicherung

Saison Alter H-Rate
2019 0–17 13,9 %
2019 18–49 22,5 %
2019 50+ 63,7 %
2020 0–17 3,9 %
2020 18–49 18,1 %
2020 50+ 78 %
2021 0–17 15,6 %
2021 18–49 23,3 %
2021 50+ 61,1 %

Symbolisches Bild einer Festplatte mit mehreren Speicherblöcken, in denen jeweils eine Spalte gespeichert ist

Konzepte des Data Warehousing

Zusammenfassung

Zeilenorientierter Speicher

  • Die Zeilendaten werden zusammen in Blöcken gespeichert.
  • Perfekt für transaktionale Workloads

Spaltenorientierter Speicher

  • Spaltendaten werden zusammen in Blöcken gespeichert.
  • Perfekt für analytische Aufgaben
  • Bessere Datenkomprimierung
Konzepte des Data Warehousing

Es ist Zeit zum Üben!

Konzepte des Data Warehousing

Preparing Video For Download...