Régression logistique pour la probabilité de défaut

Modélisation du risque de crédit en Python

Michael Crabtree

Data Scientist, Ford Motor Company

Probabilité de défaut

Probabilité de défaut	Interprétation	Statut de prêt prédit
0.4	Peu probable de faire défaut	0
0.90	Très probable de faire défaut	1
0.1	Très peu probable de faire défaut	0

Probabilités de défaut issues du machine learning
- Apprendre à partir des colonnes (features)
Modèles de classification (défaut, non défaut)
Deux modèles courants :
- Régression logistique
- Arbre de décision

Exemple de régression logistique et d’arbre de décision

Similaire à la régression linéaire, mais produit seulement des valeurs entre 0 et 1

Formule pour régression linéaire et régression logistique

Exemple de graphes : régression linéaire et régression logistique

from sklearn.linear_model import LogisticRegression

clf_logistic = LogisticRegression(solver='lbfgs')

clf_logistic.fit(training_columns, np.ravel(training_labels))

Sous-ensemble	Usage	Part
Train	Apprendre à prédire à partir des données	60%
Test	Évaluer sur des données inédites	40%

X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)

Modélisation du risque de crédit en Python