SQL-Datenbanken

Grundlagen von Data Engineering

Hadrien Lacroix

Content Developer at DataCamp

SQL

  • Structured Query Language (strukturierte Abfragesprache)
  • Industriestandard für relationale Datenbankmanagementsysteme (RDBMS)
  • Gleichzeitiges Zugreifen auf Datensätze sowie Gruppieren, Filtern, Aggregieren
  • Nahe am geschriebenen Englisch, leicht zu schreiben und zu verstehen
  • Data Engineers verwenden SQL, um Datenbanken zu erstellen und zu pflegen
  • Data Scientists nutzen SQL, um Datenbanken abzufragen (Informationen zu erhalten)
Grundlagen von Data Engineering

Hier noch einmal die Personaltabelle

index last_name first_name role team full_time office
0 Thien Vivian Data Engineer Data Science 1 Belgien
1 Huong Julian Data Scientist Data Science 1 Belgien
2 Duplantier Norbert Software Developer Infrastructure 1 Vereinigtes Königreich
3 McColgan Jeff Business Developer Verkauf 1 Vereinigte Staaten
4 Sanchez Rick Support Agent Customer Service 0 Vereinigte Staaten
Grundlagen von Data Engineering

SQL für Data Engineers

  • Data Engineers erstellen, pflegen und aktualisieren mit SQL Tabellen.
CREATE TABLE employees (

employee_id INT,
first_name VARCHAR(255),
last_name VARCHAR(255),
role VARCHAR(255),
team VARCHAR(255),
full_time BOOLEAN,
office VARCHAR(255)
);
Grundlagen von Data Engineering

SQL für Data Scientists

  • Data Scientists fragen mit SQL Daten in Tabellen ab und filtern, gruppieren und aggregieren sie.
SELECT first_name, last_name

FROM employees
WHERE role LIKE '%Data%'
Grundlagen von Data Engineering

Datenbankschema

  • Datenbanken bestehen aus Tabellen
  • Das Datenbankschema bestimmt, wie die Tabellen in Beziehung stehen
Grundlagen von Data Engineering

Alben-Tabelle

Grundlagen von Data Engineering

Artists-Tabelle

Grundlagen von Data Engineering

Die Artists-Tabelle ist mit der Alben-Tabelle über den eindeutigen Schlüssel artist_id verbunden.

Grundlagen von Data Engineering

Song-Tabelle

Grundlagen von Data Engineering

Die Alben-Tabelle ist mit der Songs-Tabelle über den eindeutigen Schlüssel Album verbunden.

Grundlagen von Data Engineering

Playlists-Tabelle

Grundlagen von Data Engineering

Die Playlists-Tabelle ist mit der Songs-Tabelle über den eindeutigen Schlüssel Song verbunden.

Grundlagen von Data Engineering

Mehrere Umsetzungen

  • SQLite
  • MySQL
  • PostgreSQL
  • Oracle SQL
  • SQL Server
Grundlagen von Data Engineering

Zusammenfassung

  • SQL = Industriestandard
  • Wie Data Engineers und Data Scientists SQL unterschiedlich nutzen
  • Datenbankschema
  • SQL-Umsetzung
Grundlagen von Data Engineering

Lass uns üben!

Grundlagen von Data Engineering

Preparing Video For Download...