Toetsstatistieken en p-waarden

Statistical Thinking in Python (deel 2)

Justin Bois

Lecturer at the California Institute of Technology

Verschillen OH en PA?

ch3-2.002.png

1 Gegevens afkomstig van Data.gov (https://www.data.gov/)
Statistical Thinking in Python (deel 2)

Hypothesetoetsing

  • Beoordelen hoe aannemelijk de data zijn als een hypothese waar is
Statistical Thinking in Python (deel 2)

Toetsstatistiek

  • Eén getal berekend uit geobserveerde data en uit data gesimuleerd onder de nulhypothese
  • Vormt de basis voor vergelijking tussen beide
Statistical Thinking in Python (deel 2)

Permutatiereplicaat

np.mean(perm_sample_PA) - np.mean(perm_sample_OH)
1.122220149253728
np.mean(dem_share_PA) - np.mean(dem_share_OH) # orig. data
1.1582360922659518
Statistical Thinking in Python (deel 2)

Gemiddeld stemverschil onder de nulhypothese

ch3-2.014.png

1 Gegevens afkomstig van Data.gov (https://www.data.gov/)
Statistical Thinking in Python (deel 2)

Gemiddeld stemverschil onder de nulhypothese

ch3-2.016.png

1 Gegevens afkomstig van Data.gov (https://www.data.gov/)
Statistical Thinking in Python (deel 2)

p-waarde

  • De kans op een waarde van je toetsstatistiek die minstens zo extreem is als geobserveerd, uitgaande van een ware nulhypothese
  • NIET de kans dat de nulhypothese waar is
Statistical Thinking in Python (deel 2)

Statistische significantie

  • Bepaald door hoe klein de p-waarde is
Statistical Thinking in Python (deel 2)

Null hypothesis significance testing (NHST)

  • Een andere naam voor wat we in dit hoofdstuk doen
Statistical Thinking in Python (deel 2)

statistische significantie ≠ praktische significantie

Statistical Thinking in Python (deel 2)

Laten we oefenen!

Statistical Thinking in Python (deel 2)

Preparing Video For Download...