Python ile Kredi Riski Modellemesi
Michael Crabtree
Data Scientist, Ford Motor Company
loan_status temerrüt olasılığını tahmin eden basit karar ağacı| Kredi | Gerçek durum | Tahmin edilen durum | Geri ödeme tutarı | Satış değeri | Kazanç/Kayıp |
|---|---|---|---|---|---|
| 1 | 0 | 1 | $1,500 | $250 | -$1,250 |
| 2 | 0 | 1 | $1,200 | $250 | -$950 |
xgboost Python paketinin bir parçasıdır; burada xgb olarak kullanılır.fit() ile eğitilir# Bir lojistik regresyon modeli oluştur
clf_logistic = LogisticRegression()
# Lojistik regresyonu eğit
clf_logistic.fit(X_train, np.ravel(y_train))
# Bir gradient artırılmış ağaç modeli oluştur
clf_gbt = xgb.XGBClassifier()
# Gradient artırılmış ağacı eğit
clf_gbt.fit(X_train,np.ravel(y_train))
.predict() hem de .predict_proba() ile tahmin eder.predict_proba() 0 ile 1 arasında olasılık döndürür.predict() loan_status için 1 veya 0 döndürür# Temerrüt olasılıklarını tahmin et
gbt_preds_prob = clf_gbt.predict_proba(X_test)
# loan_status'u 1 veya 0 olarak tahmin et
gbt_preds = clf_gbt.predict(X_test)
# gbt_preds_prob
array([[0.059, 0.940], [0.121, 0.989]])
# gbt_preds
array([1, 1, 0...])
learning_rate: daha küçük değerler adımları daha temkinli yaparmax_depth: ağacın derinliğini sınırlar; daha büyük, daha karmaşık demektirxgb.XGBClassifier(learning_rate = 0.2,
max_depth = 4)
Python ile Kredi Riski Modellemesi