Pemodelan Risiko Kredit dengan Python
Michael Crabtree
Data Scientist, Ford Motor Company
loan_status| Pinjaman | Status sebenarnya | Status prediksi | Nilai pelunasan | Nilai jual | Untung/Rugi |
|---|---|---|---|---|---|
| 1 | 0 | 1 | $1,500 | $250 | -$1,250 |
| 2 | 0 | 1 | $1,200 | $250 | -$950 |
xgboost, disingkat xgb.fit() seperti model regresi logistik# Buat model regresi logistik
clf_logistic = LogisticRegression()
# Latih regresi logistik
clf_logistic.fit(X_train, np.ravel(y_train))
# Buat model pohon boosting gradien
clf_gbt = xgb.XGBClassifier()
# Latih pohon boosting gradien
clf_gbt.fit(X_train,np.ravel(y_train))
.predict() dan .predict_proba().predict_proba() menghasilkan nilai antara 0 dan 1.predict() menghasilkan 1 atau 0 untuk loan_status# Prediksi probabilitas gagal bayar
gbt_preds_prob = clf_gbt.predict_proba(X_test)
# Prediksi loan_status sebagai 1 atau 0
gbt_preds = clf_gbt.predict(X_test)
# gbt_preds_prob
array([[0.059, 0.940], [0.121, 0.989]])
# gbt_preds
array([1, 1, 0...])
learning_rate: makin kecil, tiap langkah makin konservatifmax_depth: batas kedalaman tiap pohon; lebih besar = lebih kompleksxgb.XGBClassifier(learning_rate = 0.2,
max_depth = 4)
Pemodelan Risiko Kredit dengan Python