Datenplanung

Grundlagen von Data Engineering

Hadrien Lacroix

Content Developer at DataCamp

Datenplanung

  • Kann für jede in der Datenverarbeitung aufgeführte Aufgabe gelten
  • Die Datenplanung ist der Klebstoff deines Systems
  • Behält alle Bausteine im Auge und organisiert sie
  • Führt Aufgaben in einer bestimmten Reihenfolge aus und löst alle Abhängigkeiten auf
Grundlagen von Data Engineering

Datenplanung: manuell, zeitgebunden, sensorisch

  • Manuell
  • Manuelles Aktualisieren der Personaltabelle
Grundlagen von Data Engineering

Datenpipeline

Grundlagen von Data Engineering

Das Bild zeigt eine Uhr; die Personaltabelle der wird jeden Morgen um 6 Uhr aktualisiert.

Grundlagen von Data Engineering

Datenplanung: manuell, zeitgebunden, sensorisch

  • Manuell
  • Automatisch zu einer bestimmten Zeit ausführen
  • Automatisch ausführen, wenn eine Bedingung erfüllt ist:
    • Sensor Scheduling
  • Manuelles Aktualisieren der Personaltabelle
  • Aktualisieren der Personaltabelle um 06:00 Uhr
Grundlagen von Data Engineering

Datenpipeline

Grundlagen von Data Engineering

Das Bild zeigt einen Sensor, der die Tabelle der Beschäftigten vor der Aufteilung in Abteilungen abgescannt.

Grundlagen von Data Engineering

Datenplanung: manuell, zeitgebunden, sensorisch

  • Manuell
  • Automatisch zu einer bestimmten Zeit ausführen
  • Automatisch ausführen, wenn eine Bedingung erfüllt ist:
    • Sensor Scheduling
  • Manuelles Aktualisieren der Personaltabelle
  • Aktualisieren der Personaltabelle um 06:00 Uhr
  • Aktualisieren der Abteilungs-Tabellen, wenn Personal hinzugefügt wurde
Grundlagen von Data Engineering

Batches und Streams

  • Batches
    • Gruppieren von Datensätzen in Intervallen
    • Oft günstiger
  • Streams
    • Sofortiges Senden einzelner Datensätze
  • Von Artists hochgeladene Songs
  • Personaltabelle
  • Umsatztabelle
  • Neue Nutzende melden sich an
  • Musik online vs. offline hören
Grundlagen von Data Engineering

Planungstools

airflow und luigi logos

Grundlagen von Data Engineering

Zusammenfassung

  • Was ist Datenplanung?
  • Verschiedene Möglichkeiten zur Einrichtung
  • Unterschied zwischen Batches und Streams
  • Umsetzung der Datenplanung bei Spotflix
  • Airflow, Luigi
Grundlagen von Data Engineering

Lass uns üben!

Grundlagen von Data Engineering

Preparing Video For Download...