Credit Risk Modeling in Python
Michael Crabtree
Data Scientist, Ford Motor Company
loan_status| Prestito | Loan status reale | Loan status pred. | Valore rimborso | Valore di vendita | Guadagno/Perdita |
|---|---|---|---|---|---|
| 1 | 0 | 1 | $1,500 | $250 | -$1,250 |
| 2 | 0 | 1 | $1,200 | $250 | -$950 |
xgboost, qui chiamato xgb.fit() come la regressione logistica# Crea un modello di regressione logistica
clf_logistic = LogisticRegression()
# Allena la regressione logistica
clf_logistic.fit(X_train, np.ravel(y_train))
# Crea un modello di alberi potenziati
glf_gbt = xgb.XGBClassifier()
# Allena l'albero potenziato
clf_gbt.fit(X_train,np.ravel(y_train))
.predict() e .predict_proba().predict_proba() restituisce un valore tra 0 e 1.predict() restituisce 1 o 0 per loan_status# Predici probabilità di default
gbt_preds_prob = clf_gbt.predict_proba(X_test)
# Predici loan_status come 1 o 0
gbt_preds = clf_gbt.predict(X_test)
# gbt_preds_prob
array([[0.059, 0.940], [0.121, 0.989]])
# gbt_preds
array([1, 1, 0...])
learning_rate: valori più piccoli rendono ogni passo più conservativomax_depth: profondità massima di ogni albero; più grande = più complessoxgb.XGBClassifier(learning_rate = 0.2,
max_depth = 4)
Credit Risk Modeling in Python