Lojistik regresyon nasıl çalışır

R'de Orta Düzey Regresyon

Richie Cotton

Data Evangelist at DataCamp

Kareler toplamı işe yaramaz

sum((y_pred - y_actual) ^ 2)

y_actual her zaman 0 veya 1'dir.

y_pred 0 ile 1 arasındadır.

Kareler toplamından daha iyi bir ölçüt vardır.

R'de Orta Düzey Regresyon

Olasılık

    y_pred * y_actual
R'de Orta Düzey Regresyon

Olasılık

    y_pred * y_actual + (1 - y_pred) * (1 - y_actual)
R'de Orta Düzey Regresyon

Olasılık

sum(y_pred * y_actual + (1 - y_pred) * (1 - y_actual))

y_actual = 1 iken

y_pred * 1 + (1 - y_pred) * (1 - 1) = y_pred

y_actual = 0 iken

y_pred * 0 + (1 - y_pred) * (1 - 0) = 1 - y_pred
R'de Orta Düzey Regresyon

Log-olabilirlik

  • Olasılığı hesaplamak çok küçük sayıların toplanmasını gerektirir; bu da sayısal hataya yol açar.
  • Log-olabilirlik hesaplaması daha kolaydır.
log(y_pred) * y_actual + log(1 - y_pred) * (1 - y_actual)

Her iki denklem de aynı sonucu verir.

R'de Orta Düzey Regresyon

Negatif log-olabilirlik

Log-olabilirliği ençoklamak, negatif log-olabilirliği en aza indirmeye eşdeğerdir.

-sum(log_likelihoods)
R'de Orta Düzey Regresyon

Lojistik regresyon algoritması

calc_neg_log_likelihood <- function(coeffs) {

intercept <- coeffs[1] slope <- coeffs[2]
# More calculation!
}
optim(
  par = ???,
  fn = ???
)
R'de Orta Düzey Regresyon

Ayo berlatih!

R'de Orta Düzey Regresyon

Preparing Video For Download...