Credit Risk Modeling in Python
Michael Crabtree
Data Scientist, Ford Motor Company
''| Tipo di dato mancante | Possibile risultato |
|---|---|
| NULL in colonna numerica | Errore |
| NULL in colonna stringa | Errore |
| Dato mancante | Interpretazione | Azione |
|---|---|---|
NULL in loan_status |
Prestito appena approvato | Rimuovere dai dati di previsione |
NULL in person_age |
Età non registrata o non dichiarata | Sostituire con la mediana |
isnull()sum().any() controlla tutte le colonnenull_columns = cr_loan.columns[cr_loan.isnull().any()]
cr_loan[null_columns].isnull().sum()
# Numero totale di valori null per colonna
person_home_ownership 25
person_emp_length 895
loan_intent 25
loan_int_rate 3140
cb_person_default_on_file 15
.fillna() usando funzioni e metodi aggregaticr_loan['loan_int_rate'].fillna((cr_loan['loan_int_rate'].mean()), inplace = True)
.drop()indices = cr_loan[cr_loan['person_emp_length'].isnull()].index
cr_loan.drop(indices, inplace=True)
Credit Risk Modeling in Python