Hypothesetoetsing

Inleiding tot statistiek

George Boorman

Curriculum Manager, DataCamp

Waarom hypothesetoetsing?

  • Hypothesetoetsing vergelijkt populaties

  • Hypothesetoetsing is overal!

    • Leidt een prijswijziging tot meer omzet?
    • Zorgt een andere URL voor meer verkeer?
    • Is een medicijn effectief voor een aandoening?

hand_met_pillen_op_de_handpalm.jpg

1 Beeldbron: https://unsplash.com/@towfiqu999999
Inleiding tot statistiek

De geschiedenis van hypothesetoetsing

  • Hypothesetoetsing bestaat al sinds de 18e eeuw!

 

  • Menselijke geslachtsverhouding
    • Meer mannelijke dan vrouwelijke geboorten

baby.jpg

1 Beeldbron: https://unsplash.com/@kellysikkema
Inleiding tot statistiek

Neem niets aan!

  • Begin met aannemen dat er geen verschil is
  • Dit heet de nulhypothese

 

Man-vrouw geboorteverhouding

  • Nulhypothese:

    • Geen verschil in geslachtsverhouding bij geboorten tussen vrouwen die wel of geen vitamine C gebruiken
  • Alternatieve hypothese:

    • Er is een verschil in geslachtsverhouding tussen de twee populaties
    • Meer vrouwelijke geboorten bij vrouwen die vitamine C slikken
Inleiding tot statistiek

Workflow voor hypothesetoetsing

  • Bepaal de doelpopulaties
    • Volwassen vrouwen die wel of geen vitamine C slikken
  • Formuleer nul- en alternatieve hypothesen
    • Aantal mannelijke en vrouwelijke geboorten is in beide populaties gelijk
    • Meer vrouwelijke geboorten bij vrouwen die vitamine C slikken
  • Verzamel of verkrijg steekproefdata
  • Voer statistische toetsen uit op de steekproef
  • Trek conclusies over de populatie

grote_menigte_die_een_populatie_voorstelt.jpg

groep_pionnen_die_een_steekproef_voorstelt.png

Inleiding tot statistiek

Hoeveel data hebben we nodig?

slapende_baby.jpg

  • Centrale limietstelling
    • Gemiddelden van mannelijke en vrouwelijke geboorten naderen de populatiegemiddelden naarmate n toeneemt
    • Kost veel tijd en middelen

 

  • Bepaal steekproefgrootte op basis van peer-reviewed onderzoek met vergelijkbare toetsen
1 Beeldbron: https://unsplash.com/@jxnsartstudio
Inleiding tot statistiek

Onafhankelijke en afhankelijke variabelen

  • Onafhankelijke variabele:
    • Niet beïnvloed door andere data
    • Vitamine C-suppletie

 

  • Afhankelijke variabele:
    • Beïnvloed door andere data
    • Geslachtsverhouding bij geboorten
  • Vaak gebruikt om resultaten van hypothesetoetsen te beschrijven

 

spreidingsdiagram_met_afhankelijke_variabele_op_x_as_en_onafhankelijke_variabele_op_y_as.png

Inleiding tot statistiek

Laten we oefenen!

Inleiding tot statistiek

Preparing Video For Download...