Isi nilai hilang kontinu

Rekayasa Fitur untuk Machine Learning di Python

Robert O'Callaghan

Director of Data Science, Ordergroove

Menghapus nilai hilang

  • Tidak bisa menghapus baris dengan nilai hilang di test set
Rekayasa Fitur untuk Machine Learning di Python

Apa lagi yang dapat Anda lakukan?

  • Kolom kategorikal: Ganti nilai hilang dengan nilai yang paling sering muncul atau string penanda seperti 'None'
  • Kolom numerik: Ganti nilai hilang dengan nilai yang sesuai
Rekayasa Fitur untuk Machine Learning di Python

Ukuran kecenderungan pusat

  • Mean
  • Median
Rekayasa Fitur untuk Machine Learning di Python

Menghitung ukuran kecenderungan pusat

print(df['ConvertedSalary'].mean())
print(df['ConvertedSalary'].median())
92565.16992481203
55562.0
Rekayasa Fitur untuk Machine Learning di Python

Isi nilai hilang

df['ConvertedSalary'] = df['ConvertedSalary'].fillna(
    df['ConvertedSalary'].mean()
)
df['ConvertedSalary'] = df['ConvertedSalary']\
                         .astype('int64')
Rekayasa Fitur untuk Machine Learning di Python

Membulatkan nilai

df['ConvertedSalary'] = df['ConvertedSalary'].fillna(
    round(df['ConvertedSalary'].mean())
)
Rekayasa Fitur untuk Machine Learning di Python

Ayo berlatih!

Rekayasa Fitur untuk Machine Learning di Python

Preparing Video For Download...