Paralel eğimli doğrusal regresyon

R'de Orta Düzey Regresyon

Richie Cotton

Data Evangelist at DataCamp

Önceki ders

Bu ders, Introduction to Regression in R bilgisini varsayar.

R'de Orta Düzey Regresyon

Basit regresyondan çoklu regresyona

Çoklu regresyon, birden fazla açıklayıcı değişken içeren bir regresyon modelidir.

Daha çok açıklayıcı değişken, daha fazla içgörü ve daha iyi tahmin sağlar.

R'de Orta Düzey Regresyon

Ders içeriği

Bölüm 1

  • "Paralel eğimler" regresyonu

Bölüm 2

  • Etkileşimler
  • Simpson Paradoksu

Bölüm 3

  • Daha fazla açıklayıcı değişken
  • Doğrusal regresyon nasıl çalışır

Bölüm 4

  • Çoklu lojistik regresyon
  • Lojistik dağılım
  • Lojistik regresyon nasıl çalışır
R'de Orta Düzey Regresyon

Balık veri seti

mass_g length_cm species
242.0 23.2 Bream
5.9 7.5 Perch
200.0 30.0 Pike
40.0 12.9 Roach
  • Her satır bir balığı temsil eder
  • mass_g bağımlı değişkendir
  • 1 sayısal, 1 kategorik açıklayıcı değişken
R'de Orta Düzey Regresyon

Açıklayıcı değişkenler tek tek

mdl_mass_vs_length <- lm(mass_g ~ length_cm, data = fish)
Call:
lm(formula = mass_g ~ length_cm, data = fish)

Coefficients:
(Intercept)    length_cm  
     -536.2         34.9
  • 1 sabit katsayı
  • 1 eğim katsayısı
mdl_mass_vs_species <- lm(mass_g ~ species + 0, data = fish)
Call:
lm(formula = mass_g ~ species + 0, data = fish)

Coefficients:
speciesBream  speciesPerch   speciesPike  speciesRoach  
       617.8         382.2         718.7         152.0
  • Her kategori için 1 sabit katsayı
R'de Orta Düzey Regresyon

Her iki değişken birlikte

mdl_mass_vs_both <- lm(mass_g ~ length_cm + species + 0, data = fish)
Call:
lm(formula = mass_g ~ length_cm + species + 0, data = fish)

Coefficients:
   length_cm  speciesBream  speciesPerch   speciesPike  speciesRoach  
       42.57       -672.24       -713.29      -1089.46       -726.78 
  • 1 eğim katsayısı
  • Her kategori için 1 sabit katsayı
R'de Orta Düzey Regresyon

Katsayıları karşılaştırma

coefficients(mdl_mass_vs_length)
(Intercept)   length_cm 
     -536.2        34.9
coefficients(mdl_mass_vs_species)
speciesBream speciesPerch  speciesPike speciesRoach 
       617.8        382.2        718.7        152.0
coefficients(mdl_mass_vs_both)
length_cm speciesBream speciesPerch  speciesPike speciesRoach 
    42.57      -672.24      -713.29     -1089.46      -726.78 
R'de Orta Düzey Regresyon

Görselleştirme: 1 sayısal açıklayıcı değişken

library(ggplot2)

ggplot(fish, aes(length_cm, mass_g)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

kütle-uzunluk-dağılım-balık.png

R'de Orta Düzey Regresyon

Görselleştirme: 1 kategorik açıklayıcı değişken

ggplot(fish, aes(species, mass_g)) +
  geom_boxplot() + 
  stat_summary(fun.y = mean, shape = 15)

kütle-türe-göre-dağılım-balık.png

R'de Orta Düzey Regresyon

Görselleştirme: her iki açıklayıcı değişken

library(moderndive)

ggplot(fish, aes(length_cm, mass_g, color = species)) +
  geom_point() +
  geom_parallel_slopes(se = FALSE)

kütle-uzunluk-her-ikisi-dağılım-balık.png

R'de Orta Düzey Regresyon

Hadi pratik yapalım!

R'de Orta Düzey Regresyon

Preparing Video For Download...