Kredietrisicomodellering in Python
Michael Crabtree
Data Scientist, Ford Motor Company
''| Type missende data | Mogelijk resultaat |
|---|---|
| NULL in numerieke kolom | Error |
| NULL in stringkolom | Error |
| Missende data | Interpretatie | Actie |
|---|---|---|
NULL in loan_status |
Lening net goedgekeurd | Verwijderen uit predictiedata |
NULL in person_age |
Leeftijd niet vastgelegd of gemeld | Vervangen door mediaan |
isnull()sum().any() controleert alle kolommennull_columns = cr_loan.columns[cr_loan.isnull().any()]
cr_loan[null_columns].isnull().sum()
# Totaal aantal null-waarden per kolom
person_home_ownership 25
person_emp_length 895
loan_intent 25
loan_int_rate 3140
cb_person_default_on_file 15
.fillna() en aggregatiescr_loan['loan_int_rate'].fillna((cr_loan['loan_int_rate'].mean()), inplace = True)
.drop()indices = cr_loan[cr_loan['person_emp_length'].isnull()].index
cr_loan.drop(indices, inplace=True)
Kredietrisicomodellering in Python