Model performansını değerlendirme

R'de Orta Düzey Regresyon

Richie Cotton

Data Evangelist at DataCamp

Model performans metrikleri

  • Belirleme katsayısı (R‑kare): doğrusal regresyon doğrusunun gözlemlere uyumu.

    • Daha büyük iyidir.
  • Artıkların standart hatası (RSE): artıkların tipik büyüklüğü.

    • Daha küçük iyidir.
R'de Orta Düzey Regresyon

Belirleme katsayısını almak

library(dplyr)
library(broom)
mdl_mass_vs_length %>% 
  glance() %>% 
  pull(r.squared)
0.8226
mdl_mass_vs_species %>% 
  glance() %>% 
  pull(r.squared)
0.7163
mdl_mass_vs_both %>% 
  glance() %>% 
  pull(r.squared)
0.9694
R'de Orta Düzey Regresyon

Düzeltilmiş belirleme katsayısı

  • Daha fazla açıklayıcı değişken R^2’yi artırır.
  • Çok fazla açıklayıcı değişken aşırı uyuma yol açar.
  • Düzeltilmiş belirleme katsayısı, ek değişkenleri cezalandırır.
  • $\bar{R ^ 2} = 1 - (1 - R ^ 2) \frac{n_{obs} - 1}{n_{obs} - n_{var} - 1}$
  • Ceza, R^2 küçükken veya n_{var}, n_{obs}’un büyük bir kısmıyken belirgindir.
  • glance() içinde adj.r.squared öğesidir.
R'de Orta Düzey Regresyon

Düzeltilmiş belirleme katsayısını almak

library(dplyr)
library(broom)
mdl_mass_vs_length %>% 
  glance() %>% 
  select(r.squared, adj.r.squared)
  r.squared adj.r.squared
      <dbl>         <dbl>
1    0.8226        0.8212
mdl_mass_vs_species %>% 
  glance() %>% 
  select(r.squared, adj.r.squared)
  r.squared adj.r.squared
      <dbl>         <dbl>
1    0.7163        0.7072
mdl_mass_vs_both %>% 
  glance() %>% 
  select(r.squared, adj.r.squared)
  r.squared adj.r.squared
      <dbl>         <dbl>
1    0.9694        0.9682
R'de Orta Düzey Regresyon

Artıkların standart hatasını almak

library(dplyr)
library(broom)
mdl_mass_vs_length %>% 
  glance() %>% 
  pull(sigma)
152.1
mdl_mass_vs_species %>% 
  glance() %>% 
  pull(sigma)
313.6
mdl_mass_vs_both %>% 
  glance() %>% 
  pull(sigma)
103.4
R'de Orta Düzey Regresyon

Hadi pratik yapalım!

R'de Orta Düzey Regresyon

Preparing Video For Download...