Modélisation du risque de crédit en Python
Michael Crabtree
Data Scientist, Ford Motor Company
0.86loan_status vaut 1 en cas de défaut, 0 sinon0.86loan_status vaut 1 en cas de défaut, 0 sinon| Probabilité de défaut | Interprétation | Statut de prêt prédit |
|---|---|---|
| 0.4 | Peu probable de faire défaut | 0 |
| 0.90 | Très probable de faire défaut | 1 |
| 0.1 | Très peu probable de faire défaut | 0 |
0 et 1from sklearn.linear_model import LogisticRegression
clf_logistic = LogisticRegression(solver='lbfgs')
.fit()clf_logistic.fit(training_columns, np.ravel(training_labels))
loan_statusloan_status (0,1)| Sous-ensemble | Usage | Part |
|---|---|---|
| Train | Apprendre à prédire à partir des données | 60% |
| Test | Évaluer sur des données inédites | 40% |
X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]
train_test_split() de scikit-learnX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)
test_size : part réservée au testrandom_state : graine aléatoire pour la reproductibilitéModélisation du risque de crédit en Python