Korelasyon

Python ile İstatistiğe Giriş

Maggie Matsui

Content Developer, DataCamp

İki değişken arasındaki ilişkiler

Memelilerin uyku alışkanlıkları saçılım grafiği: günde toplam uyku vs. günde REM uykusu

  • x = açıklayıcı/bağımsız değişken
  • y = yanıt/bağımlı değişken
Python ile İstatistiğe Giriş

Korelasyon katsayısı

  • İki değişken arasındaki doğrusal ilişkiyi ölçer
  • -1 ile 1 arasında bir sayı
  • Büyüklük, ilişkinin gücünü gösterir
  • İşaret (+ veya -), ilişkinin yönünü gösterir
Python ile İstatistiğe Giriş

Büyüklük = ilişkinin gücü

0,99 (çok güçlü ilişki)

Görünmez bir çizgiye çok yakın noktalarla saçılım grafiği

Python ile İstatistiğe Giriş

Büyüklük = ilişkinin gücü

0,99 (çok güçlü ilişki)

Görünmez bir çizgiye çok yakın noktalarla saçılım grafiği

              0,75 (güçlü ilişki)

Görünmez çizgiden daha uzak noktalarla saçılım grafiği

Python ile İstatistiğe Giriş

Büyüklük = ilişkinin gücü

0,56 (orta ilişki)

Görünmez çizgiden daha da uzak noktalı saçılım grafiği

Python ile İstatistiğe Giriş

Büyüklük = ilişkinin gücü

0,56 (orta ilişki)

Görünmez çizgiden daha da uzak noktalı saçılım grafiği

             0,21 (zayıf ilişki)

Neredeyse tamamen rastgele dağılmış noktalı saçılım grafiği

Python ile İstatistiğe Giriş

Büyüklük = ilişkinin gücü

0,04 (ilişki yok)

Tamamen rastgele dağılmış noktalı saçılım grafiği

  • x değerini bilmek y hakkında bilgi vermez
Python ile İstatistiğe Giriş

İşaret = yön

0,75: x artarken y artar

x artarken y artan saçılım grafiği

-0,75: x artarken y azalır

x artarken y azalan saçılım grafiği

Python ile İstatistiğe Giriş

İlişkileri görselleştirme

import seaborn as sns

sns.scatterplot(x="sleep_total", y="sleep_rem", data=msleep)
plt.show()

sleep_rem vs. sleep_total saçılım grafiği

Python ile İstatistiğe Giriş

Trend çizgisi ekleme

import seaborn as sns
sns.lmplot(x="sleep_total", y="sleep_rem", data=msleep, ci=None)

plt.show()

Doğrusal trend çizgili sleep_rem vs. sleep_total saçılım grafiği

Python ile İstatistiğe Giriş

Korelasyonu hesaplama

msleep['sleep_total'].corr(msleep['sleep_rem'])
0.751755

 

msleep['sleep_rem'].corr(msleep['sleep_total'])
0.751755
Python ile İstatistiğe Giriş

Korelasyonu hesaplamanın birçok yolu

  • Bu derste: Pearson çarpım-moment korelasyonu (r)
    • En yaygın
    • $\bar{x} =$ $x$'in ortalaması
    • $\sigma_x =$ $x$'in standart sapması

$$ r = \frac{1}{n - 1} \sum_{i=1}^{n} \frac{(x_i - \bar{x})(y_i - \bar{y})}{\sigma_x \cdot \sigma_y}$$

  • Bu formülün varyasyonları:
    • Kendall tau
    • Spearman rho
Python ile İstatistiğe Giriş

Hadi pratik yapalım!

Python ile İstatistiğe Giriş

Preparing Video For Download...