Filtrer les valeurs manquantes

SQL intermédiaire avec l’IA

Jasmin Ludolf

Senior Data Science Content Developer

Valeurs manquantes

SELECT title, release_year
FROM films
ORDER BY release_year DESC, title ASC;
|title           |release_year|
|----------------|------------|
|10,000 B.C.     |            |
|A Touch of Frost|            |    
|Anger Management|            |    
|Animal Kingdom  |            |
...
SQL intermédiaire avec l’IA

Valeurs manquantes

SELECT COUNT(*) AS total_count
FROM films;
|total_count|
|-----------|
|4968       |
  • Compte tous les enregistrements
SELECT COUNT(language) AS language_count
FROM films;
|total_count|
|-----------|
|4957       |
  • Compte les valeurs non manquantes
SQL intermédiaire avec l’IA

Valeurs manquantes

$$

  • Perturber les calculs
  • Biaiser les moyennes
  • Cacher les tendances

$$

✅ Identifier, sélectionner, exclure les valeurs manquantes

❌ Corriger ou remplacer les valeurs manquantes

Un document cassé

SQL intermédiaire avec l’IA

Valeurs manquantes : NULLs

Causes :

  • Champs ignorés
  • Pannes système
  • Valeurs non enregistrées

$$

Valeurs manquantes :

  • NULL : vraie valeur manquante
  • " " ou "None"

Pièce de puzzle manquante

SQL intermédiaire avec l’IA

IS NULL

Invite : Afficher les titres de films et les langues sans langue définie

SELECT title, language
FROM films
WHERE language IS NULL;
|title               |language|
|--------------------|--------|
|Intolerance: Love...|        |
|Over the Hill to ...|        |
|The Big Parade      |        |
...
SQL intermédiaire avec l’IA

IS NOT NULL

Invite : Afficher les titres de films et les langues avec une langue définie

SELECT title, language
FROM films
WHERE language IS NOT NULL;
|title              |language|
|-------------------|--------|
|Metropolis         |German  |
|Pandora's Box      |German  |
|The Broadway Melody|English |
|Quest for Fire     |None    |
...
SQL intermédiaire avec l’IA

Identifier d'autres inconnues

Point d'interrogation

$$

  • IS NULL et IS NOT NULL ne capturent que les vraies valeurs manquantes

$$

  • Qu'en est-il de "Non disponible", "None" ?
    • Pas de vraies valeurs manquantes NULL
    • Mais toujours manquantes ou inconnues
SQL intermédiaire avec l’IA

Identifier d'autres inconnues

Invite : Afficher les titres de films et les langues où la langue est 'None'

SELECT title, language
FROM films
WHERE language = 'None';
|title              |language|
|-------------------|--------|
|Quest for Fire     |None    |
|Samsara            |None    |
SQL intermédiaire avec l’IA

Trouver des variations

Invite : Afficher toutes les valeurs de langue uniques

SELECT DISTINCT language
FROM films;
|language|
|--------|
|        |
|Arabic  |
...
|None    |
...
SQL intermédiaire avec l’IA

Filtrer les variations

Invite : Afficher les titres de films et les langues où la langue n'est ni nulle ni 'None'

SELECT title, language
FROM films
WHERE language IS NOT NULL AND language != 'None';
|title              |language|
|-------------------|--------|
|Metropolis         |German  |
|Pandora's Box      |German  |
|The Broadway Melody|English |
...
SQL intermédiaire avec l’IA

Travailler avec zéro

$$

  • Zéro :
    • Score manquant ?
    • Score de 0 ?

$$

  • Contexte requis :
    • Documentation
    • Directives commerciales

Zéro

SQL intermédiaire avec l’IA

Gérer les valeurs manquantes

  • Compétence d'analyse importante
  • Peut influencer les conclusions

$$

  • Repérer les valeurs manquantes :
    • Explorer les champs pour identifier les valeurs manquantes
    • Filtrer si nécessaire
    • Les fonctions d'agrégation ignorent NULL mais incluent zéro
    • COUNT(*) inclut toutes les lignes, y compris NULL

Loupe

SQL intermédiaire avec l’IA

Prêt pour la pratique ?

SQL intermédiaire avec l’IA

Preparing Video For Download...