Nilai yang hilang

Manipulasi Data dengan pandas

Maggie Matsui

Senior Content Developer at DataCamp

Apa itu nilai yang hilang?

Nama Ras Warna Tinggi (cm) Berat Badan (kg) Tanggal Lahir
Bella Labrador Cokelat 56 25 01-07-2013
Charlie Poodle Hitam 43 23 16-09-2016
Lucy Chow Chow Cokelat 46 22 25-08-2014
Cooper Schnauzer Abu-abu 49 17 11-12-2011
Max Labrador Hitam 59 29 20-01-2017
Stella Chihuahua Tan 18 2 20-04-2015
Bernie St. Bernard Putih 77 74 27-02-2018
Manipulasi Data dengan pandas

Apa itu nilai yang hilang?

Nama Ras Warna Tinggi (cm) Berat Badan (kg) Tanggal Lahir
Bella Labrador Cokelat 56 ? 01-07-2013
Charlie Poodle Hitam 43 23 16-09-2016
Lucy Chow Chow Cokelat 46 22 25-08-2014
Cooper Schnauzer Abu-abu 49 ? 11-12-2011
Max Labrador Hitam 59 29 20-01-2017
Stella Chihuahua Tan 18 2 20-04-2015
Bernie St. Bernard Putih 77 74 27-02-2018
Manipulasi Data dengan pandas

Nilai yang hilang dalam DataFrame pandas

print(dogs)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56        NaN    2013-07-01
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
3   Cooper    Schnauzer   Gray         49        NaN    2011-12-11
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Manipulasi Data dengan pandas

Mendeteksi nilai yang hilang

dogs.isna()
    name  breed  color  height_cm  weight_kg  date_of_birth
0  False  False  False      False       True          False
1  False  False  False      False      False          False
2  False  False  False      False      False          False
3  False  False  False      False       True          False
4  False  False  False      False      False          False
5  False  False  False      False      False          False
6  False  False  False      False      False          False
Manipulasi Data dengan pandas

Mendeteksi setiap nilai yang hilang

dogs.isna().any()
name             False
breed            False
color            False
height_cm        False
weight_kg         True
date_of_birth    False
dtype: bool
Manipulasi Data dengan pandas

Menghitung nilai yang hilang

dogs.isna().sum()
name             0
breed            0
color            0
height_cm        0
weight_kg        2
date_of_birth    0
dtype: int64
Manipulasi Data dengan pandas

Menandai nilai yang hilang

import matplotlib.pyplot as plt

dogs.isna().sum().plot(kind="bar") plt.show()

Grafik batang yang menghitung jumlah nilai yang hilang di setiap kolom kumpulan data anjing. Semua batang berada pada nol, kecuali berat badan, yang memiliki dua nilai yang hilang.

Manipulasi Data dengan pandas

Menghapus nilai hilang

dogs.dropna()
      name        breed  color  height_cm  weight_kg date_of_birth
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Manipulasi Data dengan pandas

Mengganti nilai hilang

dogs.fillna(0)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56        0.0    2013-07-01
1  Charlie       Poodle  Black         43       24.0    2016-09-16
2     Lucy    Chow Chow  Brown         46       24.0    2014-08-25
3   Cooper    Schnauzer   Gray         49        0.0    2011-12-11
4      Max     Labrador  Black         59       29.0    2017-01-20
5   Stella    Chihuahua    Tan         18        2.0    2015-04-20
6   Bernie  St. Bernard  White         77       74.0    2018-02-27
Manipulasi Data dengan pandas

Ayo berlatih!

Manipulasi Data dengan pandas

Preparing Video For Download...