Korelasyon uyarıları

R ile İstatistiğe Giriş

Maggie Matsui

Content Developer, DataCamp

Doğrusal olmayan ilişkiler

kuadratik ilişkiye sahip değişkenlerin saçılım grafiği

$$r = 0.18$$

R ile İstatistiğe Giriş

Doğrusal olmayan ilişkiler

Gördüğümüz:

kuadratik ilişki ve kuadratik eğri içeren saçılım grafiği

Korelasyon katsayısının gördüğü:

kuadratik ilişki ve doğrusal eğilim çizgisi olan saçılım grafiği

R ile İstatistiğe Giriş

Korelasyon yalnızca doğrusal ilişkileri yakalar

Korelasyon körlemesine kullanılmamalı

cor(df$x, df$y)
0.1786163

Daima verinizi görselleştirin

kuadratik ilişkiye sahip değişkenlerin saçılım grafiği

R ile İstatistiğe Giriş

Memeli uyku verileri

msleep
   name                       vore  sleep_total awake  bodywt
 1 Cheetah                    carni        12.1  11.9  50    
 2 Owl monkey                 omni         17     7     0.48 
 3 Mountain beaver            herbi        14.4   9.6   1.35 
 4 Greater short-tailed shrew omni         14.9   9.1   0.019
  5 Cow                        herbi         4    20   600    
 6 Three-toed sloth           herbi        14.4   9.6   3.85 
 ... 
R ile İstatistiğe Giriş

Vücut ağırlığı ve uyanık süre

Vücut ağırlığı ve uyanık kalma süresi saçılım grafiği

cor(msleep$bodywt, msleep$awake)
0.3119801
R ile İstatistiğe Giriş

Vücut ağırlığı dağılımı

bodywt değişkeninin histogramı

R ile İstatistiğe Giriş

Log dönüşümü

msleep %>%
  mutate(log_bodywt = log(bodywt)) %>%

ggplot(aes(log_bodywt, awake)) + geom_point() + geom_smooth(method = "lm", se = FALSE)

 

cor(msleep$log_bodywt, msleep$awake)
0.5687943

log bodywt ve awake saçılım grafiği

R ile İstatistiğe Giriş

Diğer dönüşümler

  • Log dönüşümü (log(x))
  • Kareköklü dönüşüm (sqrt(x))
  • Ters dönüşüm (1 / x)

  • Bunların birleşimleri, örn.:

    • log(x) ve log(y)
    • sqrt(x) ve 1 / y
R ile İstatistiğe Giriş

Neden dönüşüm kullanılır?

  • Bazı istatistiksel yöntemler değişkenlerin doğrusal olmasına dayanır
    • Korelasyon katsayısı
    • Doğrusal regresyon
R ile İstatistiğe Giriş

Korelasyon nedensellik değildir

x, y ile koreledir şunu ifade etmez: x, y'ye neden olur

ABD'de kişi başı margarin tüketimi ile Maine boşanma oranı saçılım grafiği. Değişkenler r=0,99 ile yüksek korelasyonlu.

R ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içme (x) akciğer kanserine (y) işaret ediyor

R ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içme (x) akciğer kanserine (y) işaret ediyor; üzerinde sigara (karıştırıcı)

R ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içme (x) akciğer kanserine (y) işaret ediyor; sigara (karıştırıcı). Kahve ve sigara arasında "ilişki" çift yönlü ok.

R ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içme (x) akciğer kanserine (y) işaret ediyor; sigara (karıştırıcı). Kahve ve sigara arasında "ilişki" çift yönlü ok. Sigara’dan akciğer kanserine "nedensellik" oku.

R ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içme (x) ile akciğer kanseri (y) arasında "ilişki" çift yönlü ok. Kahve ve sigara arasında "ilişki" çift yönlü ok. Sigara’dan akciğer kanserine "nedensellik" oku.

  Tatil (x) perakende satışları (y) etkiliyor. Özel kampanyalar (karıştırıcı) ile tatil arasında çift yönlü, perakende satışlara tek yönlü ok.

R ile İstatistiğe Giriş

Hadi pratik yapalım!

R ile İstatistiğe Giriş

Preparing Video For Download...