Basis van inferentie in R
Jo Hardin
Instructor
# Vergelijk betrouwbaarheidsintervallen
one_poll_boot %>% summarize(
lower = p_hat - 2 *
sd(prop_yes_boot),
upper = p_hat + 2 *
sd(prop_yes_boot))
# A tibble: 1 × 2
lower upper
<dbl> <dbl>
1 0.536148 0.863852
# Vind 2,5% en 97,5% van p-hat-waarden
one_poll_boot %>% summarize(
q025_prop = quantile(prop_yes_boot,
p = .025),
q975_prop = quantile(prop_yes_boot,
p = .975))
# A tibble: 1 × 2
q025_prop q975_prop
<dbl> <dbl>
1 0.5333333 0.8333333
Doel: de parameter vinden terwijl we alleen de statistiek kennen
Je weet nooit of je steekproef de echte parameter bevat
Bootstrap t-CI: (0,536, 0,864)
Percentiel-interval: (0,533, 0,833)
We zijn 95% zeker dat het echte aandeel mensen dat op kandidaat X wil stemmen tussen 0,536 en 0,864 ligt (of 0,533 en 0,833).
Steekproefverdeling van de statistiek is redelijk symmetrisch en klokvormig
Steekproefgrootte is redelijk groot
Variabiliteit van hersteekproef-aandelen
Basis van inferentie in R