Fehlende Werte

Datenbearbeitung mit pandas

Maggie Matsui

Senior Content Developer at DataCamp

Was ist ein fehlender Wert?

Name Rasse Farbe Größe (cm) Gewicht (kg) Geburtsdatum
Bella Labrador Braun 56 25 2013-07-01
Charlie Pudel Schwarz 43 23 2016-09-16
Lucy Chow-Chow Braun 46 22 2014-08-25
Cooper Schnauzer Grau 49 17 2011-12-11
Max Labrador Schwarz 59 29 2017-01-20
Stella Chihuahua Hellbraun 18 2 2015-04-20
Bernie Bernhardiner Weiß 77 74 2018-02-27
Datenbearbeitung mit pandas

Was ist ein fehlender Wert?

Name Rasse Farbe Größe (cm) Gewicht (kg) Geburtsdatum
Bella Labrador Braun 56 ? 2013-07-01
Charlie Pudel Schwarz 43 23 2016-09-16
Lucy Chow-Chow Braun 46 22 2014-08-25
Cooper Schnauzer Grau 49 ? 2011-12-11
Max Labrador Schwarz 59 29 2017-01-20
Stella Chihuahua Hellbraun 18 2 2015-04-20
Bernie Bernhardiner Weiß 77 74 2018-02-27
Datenbearbeitung mit pandas

Fehlende Werte in pandas-DataFrames

print(dogs)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56        NaN    2013-07-01
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
3   Cooper    Schnauzer   Gray         49        NaN    2011-12-11
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Datenbearbeitung mit pandas

Fehlen manche Werte oder nicht?

dogs.isna()
    name  breed  color  height_cm  weight_kg  date_of_birth
0  False  False  False      False       True          False
1  False  False  False      False      False          False
2  False  False  False      False      False          False
3  False  False  False      False       True          False
4  False  False  False      False      False          False
5  False  False  False      False      False          False
6  False  False  False      False      False          False
Datenbearbeitung mit pandas

Fehlt irgendein Wert?

dogs.isna().any()
name             False
breed            False
color            False
height_cm        False
weight_kg         True
date_of_birth    False
dtype: bool
Datenbearbeitung mit pandas

Fehlende Werte zählen

dogs.isna().sum()
name             0
breed            0
color            0
height_cm        0
weight_kg        2
date_of_birth    0
dtype: int64
Datenbearbeitung mit pandas

Fehlende Werte visualisieren

import matplotlib.pyplot as plt

dogs.isna().sum().plot(kind="bar") plt.show()

Balkendiagramm mit der Anzahl der fehlenden Werte in jeder Spalte des Hunde-Datensatzes; fast alle Spalten liegen bei null; nur in der Gewichtsspalte fehlen zwei Werte

Datenbearbeitung mit pandas

Fehlende Werte entfernen

dogs.dropna()
      name        breed  color  height_cm  weight_kg date_of_birth
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Datenbearbeitung mit pandas

Fehlende Werte ersetzen

dogs.fillna(0)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56        0.0    2013-07-01
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
3   Cooper    Schnauzer   Gray         49        0.0    2011-12-11
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Datenbearbeitung mit pandas

Lass uns üben!

Datenbearbeitung mit pandas

Preparing Video For Download...