Kapanış ve notlar

R ile Kredi Riski Modellemesi

Lore Dirick

Manager of Data Science Curriculum at Flatiron School

Doğruluk için en iyi eşik?

$$

Ekran Görüntüsü 2020-06-22 14.42.06.png

$$

$\text{Doğruluk} = \frac{TP + TN}{TP + FP + TN + FN}$

R ile Kredi Riski Modellemesi

Doğruluk için en iyi eşik?

$$

Ekran Görüntüsü 2020-06-22 14.42.20.png

$$

$\text{Doğruluk} = \frac{TP + TN}{TP + FP + TN + FN}$

R ile Kredi Riski Modellemesi

Doğruluk için en iyi eşik?

$$

Ekran Görüntüsü 2020-06-22 14.42.36.png

$$

$\text{Doğruluk} = \frac{TP + TN}{TP + FP + TN + FN}$

R ile Kredi Riski Modellemesi

Doğruluk için en iyi eşik?

$$

Ekran Görüntüsü 2020-06-22 14.42.50.png

$$

$\text{Doğruluk} = \frac{TP + TN}{TP + FP + TN + FN}$

R ile Kredi Riski Modellemesi

Doğruluk için en iyi eşik?

$$

Ekran Görüntüsü 2020-06-22 14.42.50.png

$$

$\text{Doğruluk} = 89.31\%$

$\text{Test setindeki gerçek temerrüt oranı} = 10.69\%$

$$ = (100 - 89.31)\%$$

R ile Kredi Riski Modellemesi

Duyarlılık veya seçicilik ne durumda?

$$

Ekran Görüntüsü 2020-06-22 14.43.10.png

$$

$\text{Duyarlılık} = 1037 / (1037 + 0) = 100\%$

$\text{Seçicilik} = 0 / (0 + 864) = 0\%$

R ile Kredi Riski Modellemesi

Duyarlılık veya seçicilik ne durumda?

$$

Ekran Görüntüsü 2020-06-22 14.43.24.png

R ile Kredi Riski Modellemesi

Duyarlılık veya seçicilik ne durumda?

$$

Ekran Görüntüsü 2020-06-22 14.43.39.png

$$

$\text{Duyarlılık} = 0 / (0 + 1037) = 0\%$

$\text{Seçicilik} = 8640 / (8640 + 0) = 100\%$

R ile Kredi Riski Modellemesi

Lojistik regresyon hakkında…

log_model_full <- glm(loan_status ~ ., family = "binomial", data = training_set)

Aynıdır:

log_model_full <- glm(loan_status ~ ., family = binomial(link = logit), data = training_set)

Anımsatma:

$$P({\text{loan status}}=1|x_1,...,x_m) = \frac{1}{1+e^{-(\beta_0 + \beta_1 x_1 + ... + \beta_m x_m)}}$$

R ile Kredi Riski Modellemesi
log_model_full <- glm(loan_status ~ ., 
                      family = binomial(link = probit), 
                      data = training_set)

log_model_full <- glm(loan_status ~ ., 
                      family = binomial(link = cloglog), 
                      data = training_set)
  • $\beta_j < 0$
    • $x_j$ arttıkça temerrüt olasılığı azalır
  • $\beta_j > 0$
    • $x_j$ arttıkça temerrüt olasılığı artar

$$P({\text{loan status}}=1|x_1,...,x_m) = \frac{1}{1+e^{-(\beta_0 + \beta_1 x_1 + ... + \beta_m x_m)}}$$

R ile Kredi Riski Modellemesi

Haydi pratik yapalım!

R ile Kredi Riski Modellemesi

Preparing Video For Download...