Chi-kwadraattoets

Enquètegegevens analyseren in Python

EbunOluwa Andrew

Data Scientist

Chi-kwadraattoets

  • Inferenties over de verdeling van een categorische variabele
    • Vergelijkt geobserveerde met verwachte aantallen

Dobbelsteenfoto door Edge2Edge Media op Unsplash

Enquètegegevens analyseren in Python

Chi-kwadraattoets in enquête-analyse

  • Bepaal relatie tussen twee categorische variabelen in een populatie
  • $H_{o}$ = geen relatie tussen variabelen
  • $H_{a}$ = wel relatie tussen variabelen
  • p-waarde
    • als significant (<0,05), nulhypothese verwerpen
    • als niet significant (>0,05), nulhypothese accepteren
Enquètegegevens analyseren in Python

Waarom chi-kwadraattoetsen in enquêtes gebruiken

  • Voer invoervariabelen in die relevant zijn voor de uitkomstvariabele

  • Begrijp de impact van variabelen op de populatie

  • Check of verschillen toeval zijn of statistisch significant

Enquêteresultaten foto door Firmbee.com op Unsplash

1 Photo by Firmbee.com on Unsplash
Enquètegegevens analyseren in Python

Aannames van de chi-kwadraattoets bij enquêtes

  • Beide variabelen = categorisch
  • Steekproef aselect uit de populatie
  • Steekproefgrootte > 100
  • Verwachte frequenties >=5
Enquètegegevens analyseren in Python

Enquêtedata voor chi-kwadraatanalyse

pet_type current_pets time_spent reduces_stress
dog 1 420 yes
dog 1 180 yes
dog 4 30 yes
dog 1 30 yes
dog 1 60 yes
Enquètegegevens analyseren in Python

Enquêtedata voor chi-kwadraatanalyse

  • Steekproefgrootte >100
  • Twee categorische variabelen:
    • pet_type
    • reduces_stress
  • $$H_{o} $$ GEEN relatie tussen het type huisdier en ervaren stressreductie
  • $$H_{a}$$ wel relatie tussen het type huisdier en ervaren stressreductie
Enquètegegevens analyseren in Python

Stappen van chi-kwadraatanalyse op pet_survey in Python

import pandas as pd
import scipy.stats as st
data = pd.read_csv('pet_survey.csv') 

cross_table = pd.crosstab(data.reduces_stress, data.pet_type)
chi_analysis = st.chi2_contingency(cross_table)
print(chi_analysis)
|--------------------------|
| (67.7,                   | 
| 1.9e-16,                 |
| 1,                       |
| array([[1767.0, 1825.0], |
| [2251.0, 2325.0]]))      |
Enquètegegevens analyseren in Python

Resultaat en interpretatie van pet_survey

  • Frequenties >= 5

    • Geldige resultaten
  • p-waarde < 0.05

    • nulhypothese verwerpen
    • pet_owned en reduces_stress hangen samen
  • Het type huisdier beïnvloedt of eigenaren stressreductie ervaren

resultaten chi-kwadraattoets

Enquètegegevens analyseren in Python

Laten we oefenen!

Enquètegegevens analyseren in Python

Preparing Video For Download...