Valeurs aberrantes dans les données de crédit

Modélisation du risque de crédit en Python

Michael Crabtree

Data Scientist, Ford Motor Company

Traitement des données

Courbe ROC de trois modèles différents

Causes possibles des valeurs aberrantes :

Causes possibles des valeurs aberrantes :

Variable	Coefficient avec valeurs aberrantes	Coefficient sans valeurs aberrantes
Taux d’intérêt	0.2	0.01
Ancienneté d’emploi	0.5	0.6
Revenu	0.6	0.75

pd.crosstab(cr_loan['person_home_ownership'], cr_loan['loan_status'],
            values=cr_loan['loan_int_rate'], aggfunc='mean').round(2)

Nuage de points de l’ancienneté d’emploi et du taux d’intérêt du prêt

indices = cr_loan[cr_loan['person_emp_length'] >= 60].index
cr_loan.drop(indices, inplace=True)

Nuage de points du taux d’intérêt et de l’ancienneté d’emploi sans valeurs aberrantes

Modélisation du risque de crédit en Python