Kisah dua variabel

Pengantar Regresi di R

Richie Cotton

Data Evangelist at DataCamp

Data asuransi kendaraan Swedia

  • Setiap baris merepresentasikan satu wilayah geografis di Swedia.
  • Ada 63 baris.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
... ...
Pengantar Regresi di R

Statistik deskriptif

library(dplyr)
swedish_motor_insurance %>% 
  summarize_all(mean)
# A tibble: 1 x 2
  n_claims total_payment_sek
     <dbl>             <dbl>
1     22.9              98.2
swedish_motor_insurance %>% 
  summarize(
    correlation = cor(n_claims, total_payment_sek)
  )
# A tibble: 1 x 1
  correlation
        <dbl>
1       0.881
Pengantar Regresi di R

Apa itu regresi?

  • Model statistik untuk mengeksplorasi hubungan antara variabel respons dan variabel penjelas.
  • Dengan nilai variabel penjelas, Anda dapat memprediksi nilai variabel respons.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
200 ???
Pengantar Regresi di R

Istilah teknis

Variabel respons (variabel terikat)

Variabel yang ingin diprediksi.

Variabel penjelas (variabel bebas)

Variabel yang menjelaskan bagaimana variabel respons berubah.

Pengantar Regresi di R

Regresi linear dan logistik

Regresi linear

  • Variabel respons bersifat numerik.

Regresi logistik

  • Variabel respons bersifat logis.

Regresi linear/logistik sederhana

  • Hanya ada satu variabel penjelas.
Pengantar Regresi di R

Memvisualisasikan pasangan variabel

library(ggplot2)

ggplot(
  swedish_motor_insurance, 
  aes(n_claims, total_payment_sek)
) +
  geom_point()

Plot sebar total pembayaran vs jumlah klaim. Pembayaran meningkat saat jumlah klaim meningkat.

Pengantar Regresi di R

Menambahkan garis tren linear

library(ggplot2)

ggplot(
  swedish_motor_insurance, 
  aes(n_claims, total_payment_sek)
) +
  geom_point() +
  geom_smooth(
    method = "lm", 
    se = FALSE
  )

Plot sebar yang sama dengan garis tren tambahan dari regresi linear. Garisnya sesuai dengan data.

Pengantar Regresi di R

Alur kursus

Bab 1

Memvisualisasikan dan memodelkan regresi linear.

Bab 2

Membuat prediksi dari regresi linear dan memahami koefisien model.

Bab 3

Menilai kualitas model regresi linear.

Bab 4

Sama, tetapi dengan regresi logistik.

Pengantar Regresi di R

Ayo berlatih!

Pengantar Regresi di R

Preparing Video For Download...