Pemilihan kolom untuk risiko kredit

Pemodelan Risiko Kredit dengan Python

Michael Crabtree

Data Scientist, Ford Motor Company

Memilih kolom tertentu

  • Kita memakai semua kolom untuk prediksi
# Memilih beberapa kolom tertentu
X_multi = cr_loan_prep[['loan_int_rate','person_emp_length']]
# Memilih semua data kecuali loan_status
X = cr_loan_prep.drop('loan_status', axis = 1)
  • Cara menilai pentingnya tiap kolom
    • Regresi Logistik: koefisien kolom
    • Gradient Boosted Trees: ?
Pemodelan Risiko Kredit dengan Python

Kepentingan kolom

  • Gunakan metode .get_booster() dan .get_score()
    • Weight: jumlah kemunculan kolom di semua pohon
# Melatih model
clf_gbt.fit(X_train,np.ravel(y_train))
# Cetak pentingnya fitur
clf_gbt.get_booster().get_score(importance_type = 'weight')
{'person_home_ownership_RENT': 1, 'person_home_ownership_OWN': 2}
Pemodelan Risiko Kredit dengan Python

Interpretasi kepentingan kolom

# Kepentingan kolom dari importance_type = 'weight'
{'person_home_ownership_RENT': 1, 'person_home_ownership_OWN': 2}

Pohon keputusan menggunakan XGBoost

Pemodelan Risiko Kredit dengan Python

Memplot kepentingan kolom

  • Gunakan fungsi plot_importance()
xgb.plot_importance(clf_gbt, importance_type = 'weight')
{'person_income': 315, 'loan_int_rate': 195, 'loan_percent_income': 146}

Plot kepentingan fitur

Pemodelan Risiko Kredit dengan Python

Memilih kolom pelatihan

  • Kepentingan kolom kadang dipakai untuk memilih kolom pelatihan
  • Set kolom berbeda memengaruhi kinerja model
Kolom Kepentingan Akurasi Model Recall Gagal Bayar Model
loan_int_rate, person_emp_length (100, 100) 0.81 0.67
loan_int_rate, person_emp_length, loan_percent_income (98, 70, 5) 0.84 0.52
Pemodelan Risiko Kredit dengan Python

Penilaian F1 untuk model

  • Menilai akurasi dan recall untuk grup kolom berbeda itu memakan waktu
  • Skor F1 adalah satu metrik untuk melihat akurasi dan recall sekaligus

Rumus skor F1

  • Muncul dalam classification_report()

Laporan klasifikasi dengan F1 disorot

Pemodelan Risiko Kredit dengan Python

Ayo berlatih!

Pemodelan Risiko Kredit dengan Python

Preparing Video For Download...