Fondamenti di inferenza in R
Jo Hardin
Instructor
# Confronta gli intervalli di confidenza
one_poll_boot %>% summarize(
lower = p_hat - 2 *
sd(prop_yes_boot),
upper = p_hat + 2 *
sd(prop_yes_boot))
# A tibble: 1 × 2
lower upper
<dbl> <dbl>
1 0.536148 0.863852
# Trova il 2,5% e il 97,5% dei valori di p-hat
one_poll_boot %>% summarize(
q025_prop = quantile(prop_yes_boot,
p = .025),
q975_prop = quantile(prop_yes_boot,
p = .975))
# A tibble: 1 × 2
q025_prop q975_prop
<dbl> <dbl>
1 0.5333333 0.8333333
L’obiettivo è stimare il parametro conoscendo solo la statistica
Non saprai mai se il campione contiene davvero il vero parametro
IC bootstrap t: (0,536, 0,864)
Intervallo percentile: (0,533, 0,833)
Siamo certi al 95% che la vera proporzione di persone che intendono votare il candidato X sia tra 0,536 e 0,864 (o tra 0,533 e 0,833)
La distribuzione campionaria della statistica è abbastanza simmetrica e a campana
La dimensione del campione è sufficientemente grande
Variabilità delle proporzioni ricampionate
Fondamenti di inferenza in R