Kredi Verilerinde Aykırı Değerler

Python ile Kredi Riski Modellemesi

Michael Crabtree

Data Scientist, Ford Motor Company

Veri işleme

  • Hazırlanmış veriler modellerin daha hızlı eğitilmesini sağlar
  • Çoğunlukla model performansını olumlu etkiler

Üç farklı modelin ROC grafiği

Python ile Kredi Riski Modellemesi

Aykırı değerler ve performans

Aykırı değerlerin olası nedenleri:

  • Veri giriş sistemlerinde sorunlar (insan hatası)
  • Veri alma araçlarında sorunlar
Python ile Kredi Riski Modellemesi

Aykırı değerler ve performans

Aykırı değerlerin olası nedenleri:

  • Veri giriş sistemlerinde sorunlar (insan hatası)
  • Veri alma araçlarında sorunlar
Özellik Aykırı Değerlerle Katsayı Aykırı Değerler Olmadan Katsayı
Faiz Oranı 0.2 0.01
İstihdam Süresi 0.5 0.6
Gelir 0.6 0.75
Python ile Kredi Riski Modellemesi

Çapraz tablolarla aykırı değer tespiti

  • Toplam (çapraz) tabloları özet fonksiyonlarla kullanın
pd.crosstab(cr_loan['person_home_ownership'], cr_loan['loan_status'],
            values=cr_loan['loan_int_rate'], aggfunc='mean').round(2)

Python ile Kredi Riski Modellemesi

Aykırı değerleri görsel olarak tespit etme

Aykırı değerleri görsel olarak tespit etme

  • Histogramlar
  • Saçılım grafikleri

İstihdam süresi ile kredi faiz oranının saçılım grafiği

Python ile Kredi Riski Modellemesi

Aykırı değerleri kaldırma

  • Pandas içinde .drop() yöntemini kullanın
indices = cr_loan[cr_loan['person_emp_length'] >= 60].index
cr_loan.drop(indices, inplace=True)

Aykırı değerler olmadan faiz oranı ve istihdam süresi saçılım grafiği

Python ile Kredi Riski Modellemesi

Hadi pratik yapalım!

Python ile Kredi Riski Modellemesi

Preparing Video For Download...