Fehlende Werte filtern

Fortgeschrittenes SQL mit KI

Jasmin Ludolf

Senior Data Science Content Developer

Fehlende Werte

SELECT title, release_year
FROM films
ORDER BY release_year DESC, title ASC;
|title           |release_year|
|----------------|------------|
|10,000 B.C.     |            |
|A Touch of Frost|            |    
|Anger Management|            |    
|Animal Kingdom  |            |
...
Fortgeschrittenes SQL mit KI

Fehlende Werte

SELECT COUNT(*) AS total_count
FROM films;
|total_count|
|-----------|
|4968       |
  • Zählt alle Datensätze
SELECT COUNT(language) AS language_count
FROM films;
|total_count|
|-----------|
|4957       |
  • Zählt nicht fehlende Werte
Fortgeschrittenes SQL mit KI

Fehlende Werte

$$

  • Berechnungen stören
  • Durchschnittswerte verzerren
  • Muster verbergen

$$

✅ Fehlende Werte identifizieren, auswählen, ausschließen

❌ Fehlende Werte beheben oder ersetzen

Ein kaputtes Dokument

Fortgeschrittenes SQL mit KI

Fehlende Werte: NULLs

Ursachen:

  • Felder überspringen
  • Systemausfälle
  • Werte nicht erfasst

$$

Fehlende Werte:

  • NULL: echter fehlender Wert
  • " " oder "None"

Fehlendes Puzzleteil

Fortgeschrittenes SQL mit KI

IS NULL

Aufforderung: Film-Titel und Sprachen ohne Sprache anzeigen

SELECT title, language
FROM films
WHERE language IS NULL;
|title               |language|
|--------------------|--------|
|Intolerance: Love...|        |
|Over the Hill to ...|        |
|The Big Parade      |        |
...
Fortgeschrittenes SQL mit KI

IS NOT NULL

Aufforderung: Film-Titel und Sprachen mit definierter Sprache anzeigen

SELECT title, language
FROM films
WHERE language IS NOT NULL;
|title              |language|
|-------------------|--------|
|Metropolis         |German  |
|Pandora's Box      |German  |
|The Broadway Melody|English |
|Quest for Fire     |None    |
...
Fortgeschrittenes SQL mit KI

Andere Unbekannte identifizieren

Fragezeichen

$$

  • IS NULL und IS NOT NULL erfassen nur echte fehlende Werte

$$

  • Was ist mit "Nicht verfügbar", "None"?
    • Keine echten fehlenden NULL-Werte
    • Aber trotzdem fehlend oder unbekannt
Fortgeschrittenes SQL mit KI

Andere Unbekannte identifizieren

Aufforderung: Film-Titel und Sprachen anzeigen, wo die Sprache 'None' ist

SELECT title, language
FROM films
WHERE language = 'None';
|title              |language|
|-------------------|--------|
|Quest for Fire     |None    |
|Samsara            |None    |
Fortgeschrittenes SQL mit KI

Variationen finden

Aufforderung: Alle einzigartigen Sprachwerte anzeigen

SELECT DISTINCT language
FROM films;
|language|
|--------|
|        |
|Arabic  |
...
|None    |
...
Fortgeschrittenes SQL mit KI

Variationen filtern

Aufforderung: Film-Titel und Sprachen anzeigen, wo die Sprache nicht null oder None ist

SELECT title, language
FROM films
WHERE language IS NOT NULL AND language != 'None';
|title              |language|
|-------------------|--------|
|Metropolis         |German  |
|Pandora's Box      |German  |
|The Broadway Melody|English |
...
Fortgeschrittenes SQL mit KI

Mit Null arbeiten

$$

  • Null:
    • Fehlender Wert?
    • Wert 0?

$$

  • Kontext erforderlich:
    • Dokumentation
    • Geschäftsanweisungen

Null

Fortgeschrittenes SQL mit KI

Umgang mit fehlenden Werten

  • Wichtige Analysetechnik
  • Kann Schlussfolgerungen beeinflussen

$$

  • Fehlende Werte erkennen:
    • Felder erkunden, um fehlende Werte zu identifizieren
    • Bei Bedarf filtern
    • Aggregatfunktionen ignorieren NULL, aber schließen Null ein
    • COUNT(*) zählt alle Zeilen, einschließlich NULL

Lupe

Fortgeschrittenes SQL mit KI

Bereit für die Praxis?

Fortgeschrittenes SQL mit KI

Preparing Video For Download...