Ontwerp van experimenten

Inleiding tot statistiek in Python

Maggie Matsui

Content Developer, DataCamp

Woordenlijst

Een experiment beantwoordt: Wat is het effect van de behandeling op de respons?

  • Behandeling: verklarende/ongehankelijke variabele
  • Respons: respons/afhankelijke variabele

 

Bijv.: Wat is het effect van een advertentie op het aantal gekochte producten?

  • Behandeling: advertentie
  • Respons: aantal gekochte producten
Inleiding tot statistiek in Python

Gecontroleerde experimenten

  • Onderzoekers wijzen deelnemers toe aan behandel- of controlegroep
    • Behandelgroep ziet advertentie
    • Controlegroep niet
  • Groepen moeten vergelijkbaar zijn om causaliteit te kunnen afleiden
  • Zo niet, dan kan dat leiden tot verstorende variabelen (bias)
    • Gemiddelde leeftijd behandelgroep: 25
    • Gemiddelde leeftijd controlegroep: 50
    • Leeftijd is een mogelijke confounder
Inleiding tot statistiek in Python

De gouden standaard gebruikt...

  • Gerandomiseerde gecontroleerde trial

    • Deelnemers worden willekeurig toegewezen aan behandeling/controle, niet op basis van andere kenmerken
    • Willekeurige toewijzing helpt groepen vergelijkbaar te maken
  • Placebo

    • Lijkt op de behandeling, maar heeft geen effect
    • Deelnemers weten niet in welke groep ze zitten
    • In klinische trials zorgt een suikerpil ervoor dat het effect van het medicijn echt aan het medicijn ligt en niet aan het idee het te krijgen
Inleiding tot statistiek in Python

De gouden standaard gebruikt...

  • Dubbelblind onderzoek
    • De persoon die de behandeling toedient/het onderzoek uitvoert weet niet of de behandeling echt is of een placebo
    • Voorkomt bias in respons en/of analyse

 

Minder kans op bias = betrouwbaardere conclusie over causaliteit

Inleiding tot statistiek in Python

Observationele studies

  • Deelnemers worden niet willekeurig aan groepen toegewezen

    • Ze kiezen zelf, meestal op basis van bestaande kenmerken
  • Veel onderzoeksvragen lenen zich niet voor een gecontroleerd experiment

    • Je kunt iemand niet dwingen te roken of een ziekte te hebben
    • Je kunt iemand geen bepaald verleden geven
  • Toont associatie, geen causaliteit
    • Effecten kunnen worden verstoord door factoren die mensen in de controle- of behandelgroep brachten
    • Er zijn manieren om voor confounders te corrigeren voor betrouwbaardere conclusies over associatie
Inleiding tot statistiek in Python

Longitudinaal vs. dwarsdoorsnedeonderzoek

Longitudinaal onderzoek

  • Deelnemers worden een periode gevolgd om het effect van de behandeling op de respons te onderzoeken
  • Effect van leeftijd op lengte is niet verward met generatie
  • Duurder, resultaten duren langer

Dwarsdoorsnedeonderzoek

  • Gegevens van deelnemers worden op één moment verzameld
  • Effect van leeftijd op lengte is verward met generatie
  • Goedkoper, sneller, handiger
Inleiding tot statistiek in Python

Laten we oefenen!

Inleiding tot statistiek in Python

Preparing Video For Download...