Modélisation du risque de crédit en Python
Michael Crabtree
Data Scientist, Ford Motor Company
# Sélectionne quelques colonnes spécifiques
X_multi = cr_loan_prep[['loan_int_rate','person_emp_length']]
# Sélectionne toutes les données sauf loan_status
X = cr_loan_prep.drop('loan_status', axis = 1)
.get_booster() et .get_score()# Entraîner le modèle
clf_gbt.fit(X_train,np.ravel(y_train))
# Afficher l’importance des variables
clf_gbt.get_booster().get_score(importance_type = 'weight')
{'person_home_ownership_RENT': 1, 'person_home_ownership_OWN': 2}
# Importance des colonnes avec importance_type = 'weight'
{'person_home_ownership_RENT': 1, 'person_home_ownership_OWN': 2}
plot_importance()xgb.plot_importance(clf_gbt, importance_type = 'weight')
{'person_income': 315, 'loan_int_rate': 195, 'loan_percent_income': 146}
| Colonnes | Importances | Précision du modèle | Rappel défaut du modèle |
|---|---|---|---|
| loan_int_rate, person_emp_length | (100, 100) | 0,81 | 0,67 |
| loan_int_rate, person_emp_length, loan_percent_income | (98, 70, 5) | 0,84 | 0,52 |
classification_report()Modélisation du risque de crédit en Python