CI’s interpreteren en technische voorwaarden

Basis van inferentie in R

Jo Hardin

Instructor

CI’s maken

# Vergelijk betrouwbaarheidsintervallen
one_poll_boot %>% summarize(
    lower = p_hat - 2 * 
            sd(prop_yes_boot),
    upper = p_hat + 2 * 
            sd(prop_yes_boot))

# A tibble: 1 × 2
     lower    upper
     <dbl>    <dbl>
1 0.536148 0.863852

# Vind 2,5% en 97,5% van p-hat-waarden
one_poll_boot %>% summarize(
    q025_prop = quantile(prop_yes_boot,
                         p = .025),
    q975_prop = quantile(prop_yes_boot,
                         p = .975))

# A tibble: 1 × 2
  q025_prop q975_prop
      <dbl>     <dbl>
1 0.5333333 0.8333333

CIs motiveren

Doel: de parameter vinden terwijl we alleen de statistiek kennen
Je weet nooit of je steekproef de echte parameter bevat

De CIs interpreteren

Bootstrap t-CI: (0,536, 0,864)
Percentiel-interval: (0,533, 0,833)

We zijn 95% zeker dat het echte aandeel mensen dat op kandidaat X wil stemmen tussen 0,536 en 0,864 ligt (of 0,533 en 0,833).

Technische voorwaarden

Steekproefverdeling van de statistiek is redelijk symmetrisch en klokvormig
Steekproefgrootte is redelijk groot
Variabiliteit van hersteekproef-aandelen

Laten we oefenen!

Basis van inferentie in R