Korelasyon uyarıları

Python ile İstatistiğe Giriş

Maggie Matsui

Content Developer, DataCamp

Doğrusal olmayan ilişkiler

Kare ilişkili değişkenlerin saçılım grafiği

$$r = 0.18$$

Python ile İstatistiğe Giriş

Doğrusal olmayan ilişkiler

Gördüğümüz:

Kare ilişkili değişkenlerin saçılım grafiği ve ikinci derece eğri

Korelasyon katsayısının gördüğü:

Kare ilişkili değişkenlerin saçılım grafiği ve doğrusal eğilim çizgisi

Python ile İstatistiğe Giriş

Korelasyon yalnızca doğrusal ilişkileri yakalar

Korelasyon körlemesine kullanılmamalıdır

df['x'].corr(df['y'])
0.081094

Daima verinizi görselleştirin

Kare ilişkili değişkenlerin saçılım grafiği

Python ile İstatistiğe Giriş

Memeli uyku verisi

print(msleep)
                 name       genus   vore         order  ... sleep_cycle  awake  brainwt   bodywt
1             Cheetah    Acinonyx  carni     Carnivora  ...         NaN   11.9      NaN   50.000
2          Owl monkey       Aotus   omni      Primates  ...         NaN    7.0  0.01550    0.480
3     Mountain beaver  Aplodontia  herbi      Rodentia  ...         NaN    9.6      NaN    1.350
4 Greater short-ta...     Blarina   omni  Soricomorpha  ...    0.133333    9.1  0.00029    0.019
5                 Cow         Bos  herbi  Artiodactyla  ...    0.666667   20.0  0.42300  600.000
..                ...         ...    ...           ...  ...         ...    ...      ...      ...
79         Tree shrew      Tupaia   omni    Scandentia  ...    0.233333   15.1  0.00250    0.104
80 Bottle-nosed do...    Tursiops  carni       Cetacea  ...         NaN   18.8      NaN  173.330
81              Genet     Genetta  carni     Carnivora  ...         NaN   17.7  0.01750    2.000
82         Arctic fox      Vulpes  carni     Carnivora  ...         NaN   11.5  0.04450    3.380
83            Red fox      Vulpes  carni     Carnivora  ...    0.350000   14.2  0.05040    4.230
Python ile İstatistiğe Giriş

Vücut ağırlığı vs. uyanık süre

Vücut ağırlığı ve uyanık kalma süresi saçılım grafiği

msleep['bodywt'].corr(msleep['awake'])
0.3119801
Python ile İstatistiğe Giriş

Vücut ağırlığı dağılımı

bodywt değişkeninin histogramı

Python ile İstatistiğe Giriş

Log dönüşümü

msleep['log_bodywt'] = np.log(msleep['bodywt'])

sns.lmplot(x='log_bodywt', y='awake', data=msleep, ci=None) plt.show()
msleep['log_bodywt'].corr(msleep['awake'])
0.5687943

log bodywt ile uyanık süre saçılım grafiği

Python ile İstatistiğe Giriş

Diğer dönüşümler

  • Log dönüşümü (log(x))
  • Karekö k dönüşümü (sqrt(x))
  • Ters dönüşüm (1 / x)

  • Bunların birleşimleri, örn.:

    • log(x) ve log(y)
    • sqrt(x) ve 1 / y
Python ile İstatistiğe Giriş

Neden dönüşüm kullanılır?

  • Bazı yöntemler değişkenlerin doğrusal olmasına dayanır
    • Korelasyon katsayısı
    • Doğrusal regresyon

 

Python ile Doğrusal Modellemede Giriş

Python ile İstatistiğe Giriş

Korelasyon nedensellik değildir

                x, y ile ilişkilidir şunu göstermez: x, y’ye neden olur

ABD’de kişi başı margarin tüketimi ile Maine boşanma oranı saçılım grafiği. Değişkenler 0.99 korelasyon katsayısıyla yüksek korelasyonludur

Python ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içmek (x) akciğer kanserine (y) işaret ediyor

Python ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içmek (x) akciğer kanserine (y) işaret ediyor; sigara (karıştırıcı) yukarıda

Python ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içmek (x) akciğer kanserine (y) işaret ediyor; sigara (karıştırıcı). Sigara ile kahve arasında "ilişki" etiketli çift ok.

Python ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içmek (x) akciğer kanserine (y) işaret ediyor; sigara (karıştırıcı). Sigara ile kahve arasında "ilişki"; sigaradan akciğer kanserine "nedensellik" oku

Python ile İstatistiğe Giriş

Karıştırıcı değişken

  Kahve içmek (x) ile akciğer kanseri (y) arasında "ilişki" etiketli çift ok. Sigara ile kahve arasında "ilişki"; sigaradan akciğer kanserine "nedensellik" oku.

  Tatiller (x) perakende satışları (y) etkiliyor. Özel kampanyalar (karıştırıcı) ile tatiller arasında çift ok, perakende satışlara tek ok.

Python ile İstatistiğe Giriş

Haydi pratik yapalım!

Python ile İstatistiğe Giriş

Preparing Video For Download...