Interpretare gli IC e le condizioni tecniche

Fondamenti di inferenza in R

Jo Hardin

Instructor

Creare gli IC

# Confronta gli intervalli di confidenza
one_poll_boot %>% summarize(
    lower = p_hat - 2 * 
            sd(prop_yes_boot),
    upper = p_hat + 2 * 
            sd(prop_yes_boot))

# A tibble: 1 × 2
     lower    upper
     <dbl>    <dbl>
1 0.536148 0.863852

# Trova il 2,5% e il 97,5% dei valori di p-hat
one_poll_boot %>% summarize(
    q025_prop = quantile(prop_yes_boot,
                         p = .025),
    q975_prop = quantile(prop_yes_boot,
                         p = .975))

# A tibble: 1 × 2
  q025_prop q975_prop
      <dbl>     <dbl>
1 0.5333333 0.8333333

Perché gli IC

L’obiettivo è stimare il parametro conoscendo solo la statistica
Non saprai mai se il campione contiene davvero il vero parametro

Interpretare gli IC

IC bootstrap t: (0,536, 0,864)
Intervallo percentile: (0,533, 0,833)

Siamo certi al 95% che la vera proporzione di persone che intendono votare il candidato X sia tra 0,536 e 0,864 (o tra 0,533 e 0,833)

Condizioni tecniche

La distribuzione campionaria della statistica è abbastanza simmetrica e a campana
La dimensione del campione è sufficientemente grande
Variabilità delle proporzioni ricampionate

Passiamo alla pratica!

Fondamenti di inferenza in R