Introduzione a NHANES e ai campionamenti

Progettazione Sperimentale in R

Joanne Xiong

Data Scientist

Intro al dataset NHANES

NHANES = National Health and Nutrition Examination Survey

  • Condotto dal National Center for Health Statistics (NCHS), divisione dei Centers for Disease Control (CDC)

  • Dati raccolti in vari modi: interviste e visita medica

  • Domande su condizioni mediche, dentali, socioeconomiche, dieta e salute generale

Progettazione Sperimentale in R

Intro al campionamento

Campionamento probabilistico: si usa la probabilità per selezionare il campione (in vari modi)

Campionamento non probabilistico: non si usa la probabilità per selezionare il campione

  • Risposta volontaria: il campione è chi accetta di rispondere
  • Campione di convenienza: si scelgono soggetti comodi per il ricercatore
Progettazione Sperimentale in R

Campionamento - Parte 1

Simple Random Sampling (SRS)

  • Ogni unità nella popolazione ha uguale probabilità di essere campionata
sample()

Campionamento stratificato

  • Dividere la popolazione per una variabile di strato
  • Fare un campione casuale semplice in ogni gruppo stratificato
dataset %>% 
   group_by(strata_variable) %>% 
   slice_sample()
Progettazione Sperimentale in R

Campionamento - Parte 2

Campionamento a grappolo

  • Dividi la popolazione in gruppi chiamati grappoli
cluster(dataset, 
        cluster_var_name,
        number_to_select,
        method = "option")

Campionamento sistematico

  • Scegli un campione in modo sistematico
  • In R si implementa meglio con una funzione personalizzata

Campionamento multistadio

  • Combina uno o più metodi di campionamento
Progettazione Sperimentale in R

Passiamo alla pratica !

Progettazione Sperimentale in R

Preparing Video For Download...