CI’s interpreteren en technische voorwaarden

Basis van inferentie in R

Jo Hardin

Instructor

CI’s maken

# Vergelijk betrouwbaarheidsintervallen
one_poll_boot %>% summarize(
    lower = p_hat - 2 * 
            sd(prop_yes_boot),
    upper = p_hat + 2 * 
            sd(prop_yes_boot))
# A tibble: 1 × 2
     lower    upper
     <dbl>    <dbl>
1 0.536148 0.863852
# Vind 2,5% en 97,5% van p-hat-waarden
one_poll_boot %>% summarize(
    q025_prop = quantile(prop_yes_boot,
                         p = .025),
    q975_prop = quantile(prop_yes_boot,
                         p = .975))
# A tibble: 1 × 2
  q025_prop q975_prop
      <dbl>     <dbl>
1 0.5333333 0.8333333
Basis van inferentie in R

CIs motiveren

  • Doel: de parameter vinden terwijl we alleen de statistiek kennen

  • Je weet nooit of je steekproef de echte parameter bevat

Basis van inferentie in R

De CIs interpreteren

  • Bootstrap t-CI: (0,536, 0,864)

  • Percentiel-interval: (0,533, 0,833)

We zijn 95% zeker dat het echte aandeel mensen dat op kandidaat X wil stemmen tussen 0,536 en 0,864 ligt (of 0,533 en 0,833).

Basis van inferentie in R

Technische voorwaarden

  • Steekproefverdeling van de statistiek is redelijk symmetrisch en klokvormig

  • Steekproefgrootte is redelijk groot

  • Variabiliteit van hersteekproef-aandelen

Basis van inferentie in R

Laten we oefenen!

Basis van inferentie in R

Preparing Video For Download...