Daten gruppieren

Fortgeschrittenes SQL mit KI

Jasmin Ludolf

Senior Data Science Content Developer

Daten gruppieren

$$

  • Einblicke für bestimmte Gruppen

$$

  • Zeilen mit gleichen Werten kombinieren

$$

  • Zusammenfassungen erstellen, um Muster zu erkennen

Sammlung von Sprachbüchern

Fortgeschrittenes SQL mit KI

Einzigartig vs. Gruppen

SELECT DISTINCT language
FROM films;
|language|        
|--------|
|Danish  |
|Greek   |
|Dzongkha|
|...     |
  • Einzigartige Werte
  • Welche Sprachen haben wir?
SELECT language
FROM films
GROUP BY language;
|language|        
|--------|
|Danish  |
|Greek   |
|Dzongkha|
|...     |
  • Erstellt Gruppen
  • Wie viele Filme haben wir in jeder Sprache?
Fortgeschrittenes SQL mit KI

Aufforderungen zum Gruppieren

Aufforderung: Filme nach Sprache gruppieren

SELECT language, COUNT(*) AS lang_count
FROM films
GROUP BY language;
|language|lang_count|
|--------|----------|
|        |11        |
|Arabic  |5         |
|Kannada |1         |
|Czech   |1         |
...

$$

  • Gruppierung ist üblich mit Zusammenfassungsstatistiken:
    • z.B. Zählen, Durchschnitt

$$

  • Keine spezifische Anfrage -> COUNT()
    • Aggregatfunktion
    • Fasst mehrere Zeilen zu einem Wert zusammen
Fortgeschrittenes SQL mit KI

Häufige Gruppierungsfehler

Aufforderung: Zeige alle Filmtitel nach Sprache gruppiert

SELECT title
FROM films
GROUP BY language;
column "films.title" must appear in the
GROUP BY clause or be used in an 
aggregate function LINE 1...

KI-Korrekturen:

  • Hinzufügen einer COUNT()-Funktion
    SELECT language, COUNT(title) AS count
    FROM films
    GROUP BY language;
    
  • Auswahl der richtigen Felder
    SELECT title, language
    FROM films
    GROUP BY title, language;
    
Fortgeschrittenes SQL mit KI

Gruppierungsaufforderungen

Aufforderung: Zähle Filme nach Land und Sprache

SELECT country, language, COUNT(*) AS film_count
FROM films
GROUP BY country, language;
|country           |language|film_count|
|------------------|--------|----------|
|                  |        |1         |
|Pakistan          |Urdu    |1         |
|Mexico            |English |3         |
|Dominican Republic|Spanish |1         |
...
Fortgeschrittenes SQL mit KI

Gruppieren und sortieren

Aufforderung: Sprachranking nach Anzahl der Filme, zeige die Top 3

SELECT language, COUNT(*) AS film_count
FROM films
GROUP BY language
ORDER BY film_count DESC
LIMIT 3;
|language|film_count|
|--------|----------|
|English |4635      |
|French  |72        |
|Spanish |40        |
Fortgeschrittenes SQL mit KI

Lass uns üben!

Fortgeschrittenes SQL mit KI

Preparing Video For Download...