Temerrüt olasılığı için lojistik regresyon

Python ile Kredi Riski Modellemesi

Michael Crabtree

Data Scientist, Ford Motor Company

Temerrüt olasılığı

  • Birinin kredi temerrüdüne düşme olasılığı, temerrüt olasılığıdır
  • 0.86 gibi 0 ile 1 arasında bir olasılık değeri
  • loan_status değeri 1 ise temerrüt, 0 ise temerrüt değil
Python ile Kredi Riski Modellemesi

Temerrüt olasılığı

  • Birinin kredi temerrüdüne düşme olasılığı, temerrüt olasılığıdır
  • 0 ile 1 arasında bir olasılık değeri, örn. 0.86
  • loan_status değeri 1 ise temerrüt, 0 ise değil
Temerrüt Olasılığı Yorum Tahmin edilen durum
0.4 Temerrüt olası değil 0
0.90 Temerrüt çok olası 1
0.1 Temerrüt çok olası değil 0
Python ile Kredi Riski Modellemesi

Olasılıkları tahmin etme

  • Makine öğrenmesi çıktısı olarak temerrüt olasılıkları
    • Sütunlardaki veriden (özellikler) öğrenir
  • Sınıflandırma modelleri (temerrüt, değil)
  • En yaygın iki model:
    • Lojistik regresyon
    • Karar ağacı

Lojistik regresyon ve karar ağacı örneği

Python ile Kredi Riski Modellemesi

Lojistik regresyon

  • Doğrusal regresyona benzer, ancak yalnızca 0 ile 1 arasında değerler üretir

Doğrusal ve lojistik regresyon formülü

Doğrusal ve lojistik regresyon grafik örneği

Python ile Kredi Riski Modellemesi

Lojistik regresyonu eğitme

  • Lojistik regresyon scikit-learn paketinde mevcuttur
from sklearn.linear_model import LogisticRegression
  • Parametreli ya da parametresiz fonksiyon olarak çağrılır
clf_logistic = LogisticRegression(solver='lbfgs')
  • Eğitmek için .fit() metodunu kullanır
clf_logistic.fit(training_columns, np.ravel(training_labels))
  • Eğitim Sütunları: veride loan_status dışında kalan tüm sütunlar
  • Etiketler: loan_status (0,1)
Python ile Kredi Riski Modellemesi

Eğitim ve test

  • Tüm veri kümesi genelde ikiye bölünür
Python ile Kredi Riski Modellemesi

Eğitim ve test

  • Tüm veri kümesi genelde ikiye bölünür
Veri Alt Kümesi Kullanım Oran
Eğitim Tahmin üretmek için veriden öğrenir %60
Test Görülmemiş veride öğrenmeyi sınar %40
Python ile Kredi Riski Modellemesi

Eğitim ve test kümelerini oluşturma

  • Veriyi eğitim özellikleri ve etiketlere ayırın
X = cr_loan.drop('loan_status', axis = 1)
y = cr_loan[['loan_status']]
  • scikit-learn içindeki train_test_split() fonksiyonunu kullanın
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4, random_state=123)
  • test_size: test kümesi için veri yüzdesi
  • random_state: tekrarlanabilirlik için rastgele tohum değeri
Python ile Kredi Riski Modellemesi

Hadi pratik yapalım!

Python ile Kredi Riski Modellemesi

Preparing Video For Download...