Introductie tot NHANES en steekproeven

Experimenteel ontwerp in R

Joanne Xiong

Data Scientist

Intro op de NHANES-dataset

NHANES = National Health and Nutrition Examination Survey

  • Uitgevoerd door het National Center for Health Statistics (NCHS), onderdeel van de Centers for Disease Control (CDC)

  • Data verzameld op diverse manieren, o.a. via interviews en een lichamelijk onderzoek

  • Vragen over medische, tandheelkundige, sociaaleconomische, voedings- en algemene gezondheidsaspecten

Experimenteel ontwerp in R

Intro op steekproeven

Steekproeven met kans: kans wordt gebruikt om de steekproef te selecteren (op verschillende manieren)

Steekproeven zonder kans: kans wordt niet gebruikt om de steekproef te selecteren

  • Vrijwillige respons: wie reageert vormt de steekproef
  • Gemakssteekproef: proefpersonen die de onderzoeker gemakkelijk kan bereiken
Experimenteel ontwerp in R

Steekproeven - Deel 1

Aselecte steekproef (SRS)

  • Elke eenheid in de populatie heeft gelijke kans om te worden getrokken
sample()

Gestratificeerde steekproef

  • Populatie opdelen naar een strata-variabele
  • Binnen elke gestratificeerde groep een aselecte steekproef nemen
dataset %>% 
   group_by(strata_variable) %>% 
   slice_sample()
Experimenteel ontwerp in R

Steekproeven - Deel 2

Clustersteekproef

  • Verdeel de populatie in groepen (clusters)
cluster(dataset, 
        cluster_var_name,
        number_to_select,
        method = "option")

Systematische steekproef

  • Kies een steekproef op een systematische manier
  • In R het best met een eigen functie

Meerfasensteekproef

  • Combineert één of meer steekproefmethoden
Experimenteel ontwerp in R

Laten we oefenen!

Experimenteel ontwerp in R

Preparing Video For Download...