Valeurs manquantes

Manipulation de données avec pandas

Maggie Matsui

Senior Content Developer at DataCamp

Qu’est-ce qu’une valeur manquante ?

Nom Race Couleur Taille (cm) Poids (kg) Date de naissance
Bella Labrador Marron 56 25 2013-07-01
Charlie Caniche Noir 43 23 2016-09-16
Lucy Chow-chow Marron 46 22 2014-08-25
Cooper Schnauzer Gris 49 17 2011-12-11
Max Labrador Noir 59 29 2017-01-20
Stella Chihuahua Brun 18 2 2015-04-20
Bernie Saint-Bernard Blanc 77 74 2018-02-27
Manipulation de données avec pandas

Qu’est-ce qu’une valeur manquante ?

Nom Race Couleur Taille (cm) Poids (kg) Date de naissance
Bella Labrador Marron 56 ? 2013-07-01
Charlie Caniche Noir 43 23 2016-09-16
Lucy Chow-chow Marron 46 22 2014-08-25
Cooper Schnauzer Gris 49 ? 2011-12-11
Max Labrador Noir 59 29 2017-01-20
Stella Chihuahua Brun 18 2 2015-04-20
Bernie Saint-Bernard Blanc 77 74 2018-02-27
Manipulation de données avec pandas

Valeurs manquantes dans les DataFrames pandas

print(dogs)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56        NaN    2013-07-01
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
3   Cooper    Schnauzer   Gray         49        NaN    2011-12-11
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Manipulation de données avec pandas

Détection des valeurs manquantes

dogs.isna()
    name  breed  color  height_cm  weight_kg  date_of_birth
0  False  False  False      False       True          False
1  False  False  False      False      False          False
2  False  False  False      False      False          False
3  False  False  False      False       True          False
4  False  False  False      False      False          False
5  False  False  False      False      False          False
6  False  False  False      False      False          False
Manipulation de données avec pandas

Détection des valeurs manquantes

dogs.isna().any()
name             False
breed            False
color            False
height_cm        False
weight_kg         True
date_of_birth    False
dtype: bool
Manipulation de données avec pandas

Comptage des valeurs manquantes

dogs.isna().sum()
name             0
breed            0
color            0
height_cm        0
weight_kg        2
date_of_birth    0
dtype: int64
Manipulation de données avec pandas

Tracer les valeurs manquantes

import matplotlib.pyplot as plt

dogs.isna().sum().plot(kind="bar") plt.show()

Diagramme à barres indiquant le nombre de valeurs manquantes dans chaque colonne de l’ensemble de données sur les chiens. Toutes les barres sont à zéro, sauf le poids, pour lequel deux valeurs sont manquantes.

Manipulation de données avec pandas

Supprimer les valeurs manquantes

dogs.dropna()
      name        breed  color  height_cm  weight_kg date_of_birth
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Manipulation de données avec pandas

Remplacer les valeurs manquantes

dogs.fillna(0)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56        0.0    2013-07-01
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
3   Cooper    Schnauzer   Gray         49        0.0    2011-12-11
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Manipulation de données avec pandas

Passons à la pratique !

Manipulation de données avec pandas

Preparing Video For Download...