Data Engineering und Big Data

Grundlagen von Data Engineering

Hadrien Lacroix

Content Developer at DataCamp

Über den Kurs

  • Konzeptueller Kurs
  • Keine Programmierkenntnisse nötig
  • Zielsetzungen
    • Sich mit Data Engineers austauschen können
    • Eine solide Grundlage schaffen
Grundlagen von Data Engineering

Kapitel 1

Was ist Data Engineering?

  1. Data Engineering and Big Data
  2. Data Engineers vs. Data Scientists
  3. Daten-Pipelines
Grundlagen von Data Engineering

Kapitel 2

Wie funktioniert Datenspeicherung?

  1. Strukturierte vs. unstrukturierte Daten
  2. SQL
  3. Data Warehouse und Data Lakes
Grundlagen von Data Engineering

Kapitel 3

Wie bewegt und verarbeitet man Daten?

  1. Verarbeiten von Daten
  2. Planen von Daten
  3. Parallelverarbeitung
  4. Cloud-Computing
Grundlagen von Data Engineering

$$

$$

$$

spotflix logo

Grundlagen von Data Engineering

Daten-Workflow

Erster Schritt - Datenerhebung und -speicherung

Grundlagen von Data Engineering

Daten-Workflow

Zweiter Schritt - Datenaufbereitung

Grundlagen von Data Engineering

Daten-Workflow

Dritter Schritt - Erkundung und Visualisierung

Grundlagen von Data Engineering

Daten-Workflow

Experimentieren und Vorhersagen

Grundlagen von Data Engineering

Data Engineers

Datenerhebung und -speicherung ist eingekreist

Grundlagen von Data Engineering

Data Engineers

Data Engineers liefern:

  • die richtigen Daten,
  • in der richtigen Form,
  • an die richtigen Personen,
  • so effizient wie möglich.
Grundlagen von Data Engineering

Die Aufgaben von Data Engineers

  • Daten aus verschiedenen Quellen erfassen
  • Datenbanken für die Analyse optimieren
  • Beschädigte Daten entfernen
  • Datenarchitekturen entwickeln, konstruieren, testen und pflegen
Grundlagen von Data Engineering

Data Engineers und Big Data

  • Big Data wird die Norm =>
Grundlagen von Data Engineering

Data Engineers und Big Data

  • Big Data wird die Norm => Data Engineers werden immer häufiger gebraucht
  • Big Data:
    • Überlegen, wie wir mit Größe umgehen
    • So groß, dass traditionelle Methoden nicht mehr funktionieren
Grundlagen von Data Engineering

Wachstum von Big Data

  • Sensoren und Geräte
  • Soziale Medien
  • Unternehmensdaten
  • VoIP (Sprachkommunikation, Multimedia-Sitzungen)

Grafik zum Wachstum von Big Data

1 Datenzeitalter 2025, Seagate, November 2018
Grundlagen von Data Engineering

Die fünf Vs

  • Volume (wie viel?)
  • Variety (welche Art?)
  • Velocity (wie schnell?)
  • Veracity (wie vertrauenswürdig?)
  • Value (wie nützlich?)
Grundlagen von Data Engineering

Zusammenfassung

  • Was dich erwartet
  • Wie Daten durch ein Unternehmen fließen
  • Wann Data Engineers eingreifen
  • Was ihre Aufgaben sind
  • Wie Data Engineering mit Big Data zusammenhängt
Grundlagen von Data Engineering

Lass uns üben!

Grundlagen von Data Engineering

Preparing Video For Download...