Kreditrisikomodellierung in Python
Michael Crabtree
Data Scientist, Ford Motor Company
loan_status-Ausfallwahrscheinlichkeit| Kredit | Wahrer Status | Progn. Status | Rückzahlungswert | Verkaufswert | Gewinn/Verlust |
|---|---|---|---|---|---|
| 1 | 0 | 1 | $1,500 | $250 | -$1,250 |
| 2 | 0 | 1 | $1,200 | $250 | -$950 |
xgboost, hier xgb.fit() wie das logistische Regressionsmodell# Logistisches Regressionsmodell erstellen
clf_logistic = LogisticRegression()
# Logistische Regression trainieren
clf_logistic.fit(X_train, np.ravel(y_train))
# Gradient-Boosted-Tree-Modell erstellen
clf_gbt = xgb.XGBClassifier()
# Gradient-Boosted Tree trainieren
clf_gbt.fit(X_train,np.ravel(y_train))
.predict() und .predict_proba() voraus.predict_proba() liefert einen Wert zwischen 0 und 1.predict() liefert 1 oder 0 für loan_status# Wahrscheinlichkeiten für Zahlungsausfall vorhersagen
gbt_preds_prob = clf_gbt.predict_proba(X_test)
# loan_status als 1 oder 0 vorhersagen
gbt_preds = clf_gbt.predict(X_test)
# gbt_preds_prob
array([[0.059, 0.940], [0.121, 0.989]])
# gbt_preds
array([1, 1, 0...])
learning_rate: kleinere Werte machen jeden Schritt vorsichtigermax_depth: maximale Tiefe je Baum, größer = komplexerxgb.XGBClassifier(learning_rate = 0.2,
max_depth = 4)
Kreditrisikomodellierung in Python