Betrouwbaarheidsintervallen

Steekproeven in R

Richie Cotton

Data Evangelist at DataCamp

Betrouwbaarheidsintervallen

  • “Waarden binnen één standaarddeviatie van het gemiddelde” omvatten veel waarden in elk van deze verdelingen.
  • We definiëren een gerelateerd concept: een betrouwbaarheidsinterval.
Steekproeven in R

Het weer voorspellen

  • Rapid City, South Dakota (VS) heeft het minst voorspelbare weer.
  • Jouw taak: voorspel de maximumtemperatuur van morgen.

Een weermap, met kleuren die aangeven hoe voorspelbaar regio’s zijn.

Steekproeven in R

Jouw weervoorspelling

  • puntschatting = 47 °F (8,3 °C)
  • bereik van plausibele maximumwaarden = 40–54 °F (4,4–12,8 °C)
Steekproeven in R

Je rapporteerde zojuist een betrouwbaarheidsinterval

  • 40–54 °F is een betrouwbaarheidsinterval
  • Soms geschreven als 47 °F (40 °F, 54 °F) of 47 °F [40 °F, 54 °F]
  • … of 47 ± 7 °F
  • 7 °F is de foutmarge
Steekproeven in R

Bootstrapverdeling van gemiddelde smaak

ggplot(coffee_boot_distn, aes(resample_mean)) +
  geom_histogram(binwidth = 0.002)

Een histogram van gemiddelde koffiesmaak.

Steekproeven in R

Gemiddelde van de resamples

coffee_boot_distn %>% 
  summarize(
    mean_resample_mean = mean(resample_mean)
  )
# A tibble: 1 x 1
  mean_resample_mean
               <dbl>
1             7.5263

Een histogram van gemiddelde koffiesmaak met het gemiddelde aangegeven door een verticale blauwe balk.

Steekproeven in R

Gemiddelde plus of min één standaarddeviatie

coffee_boot_distn %>% 
  summarize(
    mean_resample_mean = mean(resample_mean),
    mean_minus_1sd = mean_resample_mean - sd(resample_mean),
    mean_plus_1sd = mean_resample_mean + sd(resample_mean)
  )
# A tibble: 1 x 3
  mean_resample_mean mean_plus_1sd mean_minus_1sd
               <dbl>         <dbl>          <dbl>
1             7.5263        7.5355         7.5171

Een histogram van koffiesmaakgemiddelden met gemiddelde en standaarddeviaties aangegeven door verticale balken.

Steekproeven in R

Kwantiellmethode voor betrouwbaarheidsintervallen

coffee_boot_distn %>% 
  summarize(
    lower = quantile(resample_mean, 0.025),
    upper = quantile(resample_mean, 0.975)
  )
# A tibble: 1 x 2
   lower  upper
   <dbl>  <dbl>
1 7.5087 7.5447

Een 95 procent betrouwbaarheidsinterval-lijn.

Steekproeven in R

Inverse cumulatieve verdelingsfunctie

  • PDF: de klokvormige curve
  • CDF: integreer voor de oppervlakte onder de curve
  • Inv. CDF: draai x- en y-assen om
normal_inv_cdf <- tibble(
  p = seq(-0.001, 0.999, 0.001),
  inv_cdf = qnorm(p)
)
ggplot(normal_inv_cdf, aes(p, inv_cdf)) +
  geom_line()

Inverse cumulatieve verdelingsfunctie.

1 Zie “Introduction to Statistics in R”, hfst. 3, “The Normal Distribution”
Steekproeven in R

Standaardfoutmethode voor betrouwbaarheidsinterval

coffee_boot_distn %>% 
  summarize(
    point_estimate = mean(resample_mean),
    std_error = sd(resample_mean),

lower = qnorm(0.025, point_estimate, std_error), upper = qnorm(0.975, point_estimate, std_error)
)
# A tibble: 1 x 4
  point_estimate std_error  lower  upper
           <dbl>     <dbl>  <dbl>  <dbl>
1         7.5263 0.0091815 7.5083 7.5443
Steekproeven in R

Laten we oefenen!

Steekproeven in R

Preparing Video For Download...