Omgaan met ontbrekende gegevens in Python
Suraj Donthi
Deep Learning & Computer Vision Consultant
Let op $-$ (variabele $\rightarrow$ gegevensveld of kolom in een DataFrame)
Definitie:
"Ontbreken heeft geen relatie met welke waarden dan ook, geobserveerd of ontbrekend"

msno.matrix(diabetes)
Definitie:
"Er is een systematische relatie tussen het ontbreken en andere geobserveerde data, maar niet met de ontbrekende data"

msno.matrix(diabetes)
Definitie:
"Er is een relatie tussen het ontbreken en de waarden zelf, ontbrekend of niet"

diabetes gesorteerd op Serum_Insulinsorted = diabetes.sort_values('Serum_Insulin')
msno.matrix(sorted)
Omgaan met ontbrekende gegevens in Python