Modélisation du risque de crédit en Python
Michael Crabtree
Data Scientist, Ford Motor Company
Causes possibles des valeurs aberrantes :
Causes possibles des valeurs aberrantes :
| Variable | Coefficient avec valeurs aberrantes | Coefficient sans valeurs aberrantes |
|---|---|---|
| Taux d’intérêt | 0.2 | 0.01 |
| Ancienneté d’emploi | 0.5 | 0.6 |
| Revenu | 0.6 | 0.75 |
pd.crosstab(cr_loan['person_home_ownership'], cr_loan['loan_status'],
values=cr_loan['loan_int_rate'], aggfunc='mean').round(2)
Détecter visuellement les valeurs aberrantes
.drop() de Pandasindices = cr_loan[cr_loan['person_emp_length'] >= 60].index
cr_loan.drop(indices, inplace=True)
Modélisation du risque de crédit en Python