İki değişkenin hikayesi

R'da Regresyona Giriş

Richie Cotton

Data Evangelist at DataCamp

İsveç motor sigortası verisi

  • Her satır İsveç’te bir coğrafi bölgeyi temsil eder.
  • 63 satır vardır.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
... ...
R'da Regresyona Giriş

Tanımlayıcı istatistikler

library(dplyr)
swedish_motor_insurance %>% 
  summarize_all(mean)
# A tibble: 1 x 2
  n_claims total_payment_sek
     <dbl>             <dbl>
1     22.9              98.2
swedish_motor_insurance %>% 
  summarize(
    correlation = cor(n_claims, total_payment_sek)
  )
# A tibble: 1 x 1
  correlation
        <dbl>
1       0.881
R'da Regresyona Giriş

Regresyon nedir?

  • Bir yanıt değişkeni ile bazı açıklayıcı değişkenler arasındaki ilişkiyi inceleyen istatistiksel modeller.
  • Açıklayıcı değişkenler verildiğinde, yanıt değişkenini tahmin edebilirsiniz.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
200 ???
R'da Regresyona Giriş

Jargon

Yanıt değişkeni (bağımlı değişken)

Tahmin etmek istediğiniz değişken.

Açıklayıcı değişkenler (bağımsız değişkenler)

Yanıt değişkeninin nasıl değişeceğini açıklayan değişkenler.

R'da Regresyona Giriş

Doğrusal ve lojistik regresyon

Doğrusal regresyon

  • Yanıt değişkeni sayısaldır.

Lojistik regresyon

  • Yanıt değişkeni mantıksaldır.

Basit doğrusal/lojistik regresyon

  • Yalnızca bir açıklayıcı değişken vardır.
R'da Regresyona Giriş

Değişken çiftlerini görselleştirme

library(ggplot2)

ggplot(
  swedish_motor_insurance, 
  aes(n_claims, total_payment_sek)
) +
  geom_point()

Toplam ödeme ile talep sayısı saçılım grafiği. Talep sayısı arttıkça ödeme artar.

R'da Regresyona Giriş

Doğrusal trend çizgisi ekleme

library(ggplot2)

ggplot(
  swedish_motor_insurance, 
  aes(n_claims, total_payment_sek)
) +
  geom_point() +
  geom_smooth(
    method = "lm", 
    se = FALSE
  )

Önceki saçılım grafiğine doğrusal regresyonla hesaplanan bir trend çizgisi eklendi. Veriye makul bir uyum sağlar.

R'da Regresyona Giriş

Kurs akışı

Bölüm 1

Doğrusal regresyon modellerini görselleştirme ve uydurma.

Bölüm 2

Doğrusal regresyonla tahmin yapma ve katsayıları anlama.

Bölüm 3

Doğrusal regresyon modelinin kalitesini değerlendirme.

Bölüm 4

Aynısı, ancak lojistik regresyon ile.

R'da Regresyona Giriş

Hadi pratik yapalım!

R'da Regresyona Giriş

Preparing Video For Download...