Ki-kare testi

Python ile Anket Verilerini Analiz Etme

EbunOluwa Andrew

Data Scientist

Ki-kare testi

  • Kategorik değişken dağılımına dair çıkarımlar
    • Gözlenen ile beklenen gözlemleri karşılaştırır

Edge2Edge Media’nın Unsplash’taki zar fotoğrafı

Python ile Anket Verilerini Analiz Etme

Anket analizinde ki-kare testi

  • Popülasyonda iki kategorik değişken arasındaki ilişkiyi belirler
  • $H_{o}$ = ilişki yok
  • $H_{a}$ = ilişki var
  • P-değeri
    • anlamlı (<0.05) ise, boş hipotezi reddet
    • anlamsız (>0.05) ise, boş hipotezi kabul et
Python ile Anket Verilerini Analiz Etme

Anket analizinde neden ki-kare testi

  • Çıktı değişkeniyle ilgili girdileri seçin

  • Değişkenlerin popülasyon üzerindeki etkisini anlayın

  • Farklar tesadüfi mi yoksa istatistiksel olarak anlamlı mı, kontrol edin

Unsplash’ta Firmbee.com’un anket sonuçları fotoğrafı

1 Unsplash’ta Firmbee.com’un fotoğrafı
Python ile Anket Verilerini Analiz Etme

Anket analizinde ki-kare varsayımları

  • Her iki değişken kategorik
  • Örneklem popülasyondan rastgele seçilir
  • Örneklem büyüklüğü > 100
  • Beklenen frekanslar >=5
Python ile Anket Verilerini Analiz Etme

Ki-kare analizine yönelik anket verisi

pet_type current_pets time_spent reduces_stress
dog 1 420 yes
dog 1 180 yes
dog 4 30 yes
dog 1 30 yes
dog 1 60 yes
Python ile Anket Verilerini Analiz Etme

Ki-kare analizine yönelik anket verisi

  • Örneklem >100
  • İki kategorik değişken:
    • pet_type
    • reduces_stress
  • $$H_{o} $$ Evcil hayvan türü ile algılanan stres azalması arasında İLİŞKİ YOK
  • $$H_{a}$$ Evcil hayvan türü ile algılanan stres azalması ARASINDA İLİŞKİ VAR
Python ile Anket Verilerini Analiz Etme

Python ile pet_survey üzerinde ki-kare adımları

import pandas as pd
import scipy.stats as st
data = pd.read_csv('pet_survey.csv') 

cross_table = pd.crosstab(data.reduces_stress, data.pet_type)
chi_analysis = st.chi2_contingency(cross_table)
print(chi_analysis)
|--------------------------|
| (67.7,                   | 
| 1.9e-16,                 |
| 1,                       |
| array([[1767.0, 1825.0], |
| [2251.0, 2325.0]]))      |
Python ile Anket Verilerini Analiz Etme

pet_survey sonucu ve yorum

  • Frekanslar >= 5

    • Geçerli sonuçlar
  • p-değeri < 0.05

    • boş hipotezi reddet
    • pet_owned ile reduces_stress ilişkilidir
  • Sahip olunan hayvan türü, stres azalması algısını etkiler

ki-kare test sonuçları

Python ile Anket Verilerini Analiz Etme

Hadi pratik yapalım!

Python ile Anket Verilerini Analiz Etme

Preparing Video For Download...