Ortalamaya regresyon

R'da Regresyona Giriş

Richie Cotton

Data Evangelist

Kavram

  • Yanıt = uyumlanan değer + artık
  • “Açıkladığınız kısım” + “açıklayamadığınız kısım”
  • Artıklar model sorunları ve temel rastlantısallık nedeniyle vardır
  • Aşırı durumlar çoğunlukla rastlantısaldır
  • Ortalamaya regresyon, aşırı durumların zamanla sürmemesi demektir
R'da Regresyona Giriş

Pearson’ın baba-oğul veri seti

  • 1078 baba/oğul çifti
  • Uzun babaların oğulları da uzun mu?
father_height_cm son_height_cm
165.2 151.8
160.7 160.6
165.0 160.9
167.0 159.5
155.3 163.3
... ...
1 Adapted from https://www.rdocumentation.org/packages/UsingR/topics/father.son
R'da Regresyona Giriş

Saçılım grafiği

plt_son_vs_father <- ggplot(
  father_son, 
  aes(father_height_cm, son_height_cm)
) +
  geom_point() +
  geom_abline(color = "green", size = 1) +
  coord_fixed()

Oğulların boylarının babaların boylarına karşı saçılım grafiği; baba ile oğulun aynı boyda olacağı bir çizgi var. Babalar uzadıkça oğullar da uzuyor.

R'da Regresyona Giriş

Regresyon çizgisi ekleme

plt_son_vs_father +
  geom_smooth(method = "lm", se = FALSE)

Oğulların boylarının babaların boylarına karşı saçılım grafiği, doğrusal eğilim çizgisiyle gösterilmiş. Eğilim çizgisi, baba ile oğulun aynı boyda olacağı çizgiden daha az diktir.

R'da Regresyona Giriş

Bir regresyon çalıştırma

mdl_son_vs_father <- lm(
  son_height_cm ~ father_height_cm, 
  data = father_son
)
Call:
lm(formula = son_height_cm ~ father_height_cm, data = father_son)

Coefficients:
     (Intercept)  father_height_cm  
          86.072             0.514
R'da Regresyona Giriş

Tahmin yapma

really_tall_father <- tibble(
  father_height_cm = 190
)
predict(mdl_son_vs_father, really_tall_father)
183.7
really_short_father <- tibble(
  father_height_cm = 150
)
predict(mdl_son_vs_father, really_short_father)
163.2
R'da Regresyona Giriş

Haydi pratik yapalım!

R'da Regresyona Giriş

Preparing Video For Download...