Kredietrisicomodellering in Python
Michael Crabtree
Data Scientist, Ford Motor Company
loan_status (kans op default) te voorspellen| Lening | Echte loan status | Voorsp. loan status | Afbetalingswaarde | Verkoopwaarde | Winst/Verlies |
|---|---|---|---|---|---|
| 1 | 0 | 1 | $1,500 | $250 | -$1,250 |
| 2 | 0 | 1 | $1,200 | $250 | -$950 |
xgboost-pakket voor Python, hier xgb.fit() net als bij logistische regressie# Maak een logistisch regressiemodel
clf_logistic = LogisticRegression()
# Train de logistische regressie
clf_logistic.fit(X_train, np.ravel(y_train))
# Maak een gradient boosted tree-model
clf_gbt = xgb.XGBClassifier()
# Train de gradient boosted tree
clf_gbt.fit(X_train,np.ravel(y_train))
.predict() als .predict_proba().predict_proba() geeft een waarde tussen 0 en 1.predict() geeft 1 of 0 voor loan_status# Voorspel kansen op default
gbt_preds_prob = clf_gbt.predict_proba(X_test)
# Voorspel loan_status als 1 of 0
gbt_preds = clf_gbt.predict(X_test)
# gbt_preds_prob
array([[0.059, 0.940], [0.121, 0.989]])
# gbt_preds
array([1, 1, 0...])
learning_rate: kleinere waarden maken elke stap voorzichtigermax_depth: hoe diep elke tree mag gaan; groter is complexerxgb.XGBClassifier(learning_rate = 0.2,
max_depth = 4)
Kredietrisicomodellering in Python