Kapan dan bagaimana menghapus data hilang

Menangani Data Hilang di Python

Suraj Donthi

Deep Learning & Computer Vision Consultant

Jenis penghapusan

  1. Penghapusan pairwise
  2. Penghapusan listwise

Catatan: Digunakan saat nilai MCAR.

Menangani Data Hilang di Python

Penghapusan Pairwise

DataFrame diabetes

Penghapusan pairwise untuk dataset diabetes 768 baris × 9 kolom

diabetes['Glucose'].mean()
121.687
diabetes.count()
763
diabetes['Glucose'].sum() / 
       diabetes['Glucose'].count()
121.687
Menangani Data Hilang di Python

Penghapusan Listwise atau Complete Case

DataFrame diabetes

Penghapusan listwise untuk dataset diabetes 768 baris × 9 kolom

diabetes.dropna(subset=['Glucose'], 
                       how='any', 
                       inplace=True)
Menangani Data Hilang di Python

Penghapusan pada DataFrame diabetes

msno.matrix(diabetes)

diabetes['Glucose'].isnull().sum()
5

Plot matriks missingness dari diabetes

Menangani Data Hilang di Python

Penghapusan pada DataFrame diabetes

diabetes.dropna(subset=["Glucose"], how='any', inplace=True)
msno.matrix(diabetes)

Plot matriks missingness dari dataset diabetes

Menangani Data Hilang di Python

Penghapusan pada DataFrame diabetes

diabetes['BMI'].isnull().sum()
11
diabetes.dropna(subset=["BMI"], how='any', inplace=True)
msno.matrix(diabetes)

Plot matriks missingness dari dataset diabetes

Menangani Data Hilang di Python

Ringkasan

  • Penghapusan pairwise
  • Penghapusan listwise
  • Penghapusan digunakan hanya saat nilai MCAR
Menangani Data Hilang di Python

Ayo berlatih!

Menangani Data Hilang di Python

Preparing Video For Download...