Regresi linear kemiringan paralel

Regresi Tingkat Menengah di R

Richie Cotton

Data Evangelist at DataCamp

Kursus sebelumnya

Kursus ini mengasumsikan pengetahuan dari Introduction to Regression in R.

Regresi Tingkat Menengah di R

Dari regresi sederhana ke regresi ganda

Regresi ganda adalah model regresi dengan lebih dari satu variabel penjelas.

Lebih banyak variabel penjelas memberi wawasan lebih dan prediksi lebih baik.

Regresi Tingkat Menengah di R

Isi kursus

Bab 1

  • Regresi "kemiringan paralel"

Bab 2

  • Interaksi
  • Paradoks Simpson

Bab 3

  • Lebih banyak variabel penjelas
  • Cara kerja regresi linear

Bab 4

  • Regresi logistik ganda
  • Distribusi logistik
  • Cara kerja regresi logistik
Regresi Tingkat Menengah di R

Dataset ikan

mass_g length_cm species
242.0 23.2 Bream
5.9 7.5 Perch
200.0 30.0 Pike
40.0 12.9 Roach
  • Setiap baris merepresentasikan 1 ikan
  • mass_g adalah variabel respons
  • 1 numerik, 1 kategorikal sebagai variabel penjelas
Regresi Tingkat Menengah di R

Satu variabel penjelas sekaligus

mdl_mass_vs_length <- lm(mass_g ~ length_cm, data = fish)
Call:
lm(formula = mass_g ~ length_cm, data = fish)

Coefficients:
(Intercept)    length_cm  
     -536.2         34.9
  • 1 koefisien intersep
  • 1 koefisien kemiringan
mdl_mass_vs_species <- lm(mass_g ~ species + 0, data = fish)
Call:
lm(formula = mass_g ~ species + 0, data = fish)

Coefficients:
speciesBream  speciesPerch   speciesPike  speciesRoach  
       617.8         382.2         718.7         152.0
  • 1 koefisien intersep untuk tiap kategori
Regresi Tingkat Menengah di R

Kedua variabel sekaligus

mdl_mass_vs_both <- lm(mass_g ~ length_cm + species + 0, data = fish)
Call:
lm(formula = mass_g ~ length_cm + species + 0, data = fish)

Coefficients:
   length_cm  speciesBream  speciesPerch   speciesPike  speciesRoach  
       42.57       -672.24       -713.29      -1089.46       -726.78 
  • 1 koefisien kemiringan
  • 1 koefisien intersep untuk tiap kategori
Regresi Tingkat Menengah di R

Membandingkan koefisien

coefficients(mdl_mass_vs_length)
(Intercept)   length_cm 
     -536.2        34.9
coefficients(mdl_mass_vs_species)
speciesBream speciesPerch  speciesPike speciesRoach 
       617.8        382.2        718.7        152.0
coefficients(mdl_mass_vs_both)
length_cm speciesBream speciesPerch  speciesPike speciesRoach 
    42.57      -672.24      -713.29     -1089.46      -726.78 
Regresi Tingkat Menengah di R

Visualisasi: 1 variabel penjelas numerik

library(ggplot2)

ggplot(fish, aes(length_cm, mass_g)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

sebar-massa-ikan-vs-panjang.png

Regresi Tingkat Menengah di R

Visualisasi: 1 variabel penjelas kategorikal

ggplot(fish, aes(species, mass_g)) +
  geom_boxplot() + 
  stat_summary(fun.y = mean, shape = 15)

sebar-massa-ikan-vs-spesies.png

Regresi Tingkat Menengah di R

Visualisasi: kedua variabel penjelas

library(moderndive)

ggplot(fish, aes(length_cm, mass_g, color = species)) +
  geom_point() +
  geom_parallel_slopes(se = FALSE)

sebar-massa-ikan-vs-keduanya.png

Regresi Tingkat Menengah di R

Ayo berlatih!

Regresi Tingkat Menengah di R

Preparing Video For Download...