Experimenteel ontwerp

Inleiding tot statistiek in R

Maggie Matsui

Content Developer, DataCamp

Woordenschat

Een experiment beantwoordt: Wat is het effect van de behandeling op de respons?

  • Behandeling: verklarende/onafhankelijke variabele
  • Respons: respons/afhankelijke variabele

 

Wat is het effect van een advertentie op het aantal gekochte producten?

  • Behandeling: advertentie
  • Respons: aantal gekochte producten
Inleiding tot statistiek in R

Gecontroleerde experimenten

  • Onderzoekers delen deelnemers in bij de behandelgroep of controlegroep
    • Behandelgroep ziet advertentie
    • Controlegroep niet
  • Groepen moeten vergelijkbaar zijn om causaliteit te kunnen afleiden
  • Zo niet, dan kan confounding (vertekening) optreden
    • Gem. leeftijd behandelgroep: 25
    • Gem. leeftijd controlegroep: 50
    • Leeftijd is een mogelijke confounder
Inleiding tot statistiek in R

De gouden standaard gebruikt...

  • Gerandomiseerde gecontroleerde trial

    • Deelnemers worden willekeurig ingedeeld, niet op basis van andere kenmerken
    • Willekeur helpt om groepen vergelijkbaar te maken
  • Placebo

    • Lijkt op de behandeling, maar heeft geen effect
    • Deelnemers weten niet in welke groep ze zitten
    • In klinische trials zorgt een suikerpil ervoor dat het effect echt door het middel komt en niet door het idee het te krijgen
Inleiding tot statistiek in R

De gouden standaard gebruikt...

  • Dubbelblind onderzoek
    • De uitvoerder weet niet of de behandeling echt is of een placebo
    • Voorkomt bias in respons en/of analyse

 

Minder kans op bias = betrouwbaardere causale conclusie

Inleiding tot statistiek in R

Observationeel onderzoek

  • Deelnemers worden niet willekeurig ingedeeld

    • Ze kiezen zelf, vaak op basis van bestaande kenmerken
  • Veel onderzoeksvragen lenen zich niet voor een gecontroleerd experiment

    • Je kunt niemand dwingen te roken of ziek te zijn
    • Je kunt iemands verleden niet bepalen
  • Toont associatie, geen causaliteit
    • Effecten kunnen verward zijn met factoren die mensen in controle- of behandelgroep brachten
    • Er zijn manieren om voor confounders te corrigeren voor betrouwbaardere associaties
Inleiding tot statistiek in R

Longitudinaal vs. dwarsdoorsnede

Longitudinaal onderzoek

  • Deelnemers worden over tijd gevolgd om het effect van de behandeling op de respons te meten
  • Het effect van leeftijd op lengte wordt niet verward met generatie
  • Duurder, resultaten duren langer

Dwarsdoorsnede-onderzoek

  • Gegevens worden op één moment in de tijd verzameld
  • Het effect van leeftijd op lengte is verward met generatie
  • Goedkoper, sneller, handiger
Inleiding tot statistiek in R

Laten we oefenen!

Inleiding tot statistiek in R

Preparing Video For Download...