Omgaan met ontbrekende gegevens in Python
Suraj Donthi
Deep Learning & Computer Vision Consultant
Let op: gebruiken bij MCAR-waarden.
diabetes DataFrame
768 rijen × 9 kolommen
diabetes['Glucose'].mean()
121.687
diabetes.count()
763
diabetes['Glucose'].sum() /
diabetes['Glucose'].count()
121.687
diabetes DataFrame
768 rijen × 9 kolommen
diabetes.dropna(subset=['Glucose'],
how='any',
inplace=True)
msno.matrix(diabetes)diabetes['Glucose'].isnull().sum()
5

diabetes.dropna(subset=["Glucose"], how='any', inplace=True)
msno.matrix(diabetes)

diabetes['BMI'].isnull().sum()
11
diabetes.dropna(subset=["BMI"], how='any', inplace=True)
msno.matrix(diabetes)

Omgaan met ontbrekende gegevens in Python