Kategorik açıklayıcı değişkenler

R'da Regresyona Giriş

Richie Cotton

Data Evangelist at DataCamp

Balık veri seti

  • Her satır bir balığı temsil eder.
  • Veri setinde 128 satır vardır.
  • 4 balık türü vardır.
species mass_g
Bream 242.0
Perch 5.9
Pike 200.0
Roach 40.0
... ...
R'da Regresyona Giriş

1 sayısal ve 1 kategorik değişkeni görselleştirme

library(ggplot2)

ggplot(fish, aes(mass_g)) +
  geom_histogram(bins = 9) +
  facet_wrap(vars(species))

Balık sayıları ile ağırlıkları arasındaki ilişkide çok panelli histogram. Her panel bir tür içerir: bream, perch, pike veya roach.

R'da Regresyona Giriş

Özet istatistik: türe göre ortalama kütle

fish %>% 
  group_by(species) %>% 
  summarize(mean_mass_g = mean(mass_g))
# A tibble: 4 x 2
  species mean_mass_g
  <chr>         <dbl>
1 Bream          618.
2 Perch          382.
3 Pike           719.
4 Roach          152.
R'da Regresyona Giriş

Doğrusal regresyon

lm(mass_g ~ species, data = fish)
Call:
lm(formula = mass_g ~ species, data = fish)

Coefficients:
 (Intercept)  speciesPerch   speciesPike  speciesRoach  
       617.8        -235.6         100.9        -465.8 
R'da Regresyona Giriş

Sabit terim yok

lm(mass_g ~ species + 0, data = fish)
Call:
lm(formula = mass_g ~ species + 0, data = fish)

Coefficients:
speciesBream  speciesPerch   speciesPike  speciesRoach  
       617.8         382.2         718.7         152.0 
R'da Regresyona Giriş

Hadi pratik yapalım!

R'da Regresyona Giriş

Preparing Video For Download...