Data hilang dan pencilan

Berlatih Pertanyaan Wawancara Statistik dengan Python

Conor Dewey

Data Scientist, Squarespace

Menangani data hilang

  • Hapus seluruh baris
  • Imputasi nilai hilang
Berlatih Pertanyaan Wawancara Statistik dengan Python

Hapus seluruh baris

df.dropna(inplace=True)

 

Berlatih Pertanyaan Wawancara Statistik dengan Python

Imputasi nilai hilang

  • Nilai konstan
  • Rekaman terpilih acak
  • Mean, median, atau modus
  • Nilai diperkirakan oleh model lain
Berlatih Pertanyaan Wawancara Statistik dengan Python

Beberapa fungsi berguna

  • isnull()
  • dropna()
  • fillna()
Berlatih Pertanyaan Wawancara Statistik dengan Python

Menangani pencilan

  • Simpangan baku
  • Rentang antarkuartil (IQR)
Berlatih Pertanyaan Wawancara Statistik dengan Python

Simpangan baku

 

Kurva Gaussian

1 Wikimedia
Berlatih Pertanyaan Wawancara Statistik dengan Python

Rentang antarkuartil (IQR)

  IQR divisualisasikan

1 Wikimedia
Berlatih Pertanyaan Wawancara Statistik dengan Python

Ringkasan

  • Hapus seluruh baris
  • Imputasi nilai hilang
  • Simpangan baku
  • Rentang antarkuartil
Berlatih Pertanyaan Wawancara Statistik dengan Python

Mari bersiap untuk wawancara!

Berlatih Pertanyaan Wawancara Statistik dengan Python

Preparing Video For Download...