Standaardfouten en de Centrale Limietstelling

Steekproeven in R

Richie Cotton

Data Evangelist at DataCamp

Steekproefverdeling van gemiddelde koppunten

Een histogram van de benaderde steekproefverdeling van het gemiddelde koppunten bij n=5.

Een histogram van de benaderde steekproefverdeling van het gemiddelde koppunten bij n=20.

Een histogram van de benaderde steekproefverdeling van het gemiddelde koppunten bij n=80.

Een histogram van de benaderde steekproefverdeling van het gemiddelde koppunten bij n=320.

Steekproeven in R

Gevolgen van de centrale limietstelling

  • Gemiddelden van onafhankelijke steekproeven zijn ongeveer normaal verdeeld.

Als n toeneemt,

  • wordt de verdeling van de gemiddelden normaler, en

  • wordt de steekproefverdeling smaller.

Steekproeven in R

Populatie- en steekproefverdeling: gemiddelden

coffee_ratings %>%
  summarize(
    mean_cup_points = mean(total_cup_points)
  ) %>% 
  pull(mean_cup_points)
82.1512
Steekproefgrootte Gem. steekproefgem.
5 82.1496
20 82.1610
80 82.1496
320 82.1521
Steekproeven in R

Populatie- en steekproefverdeling: standaarddeviaties

coffee_ratings %>%
  summarize(
    sd_cup_points = sd(total_cup_points)
  ) %>%
  pull(sd_cup_points)
2.68686
Steekproefgrootte Std.dev. steekproefgem.
5 1.1929
20 0.6028
80 0.2865
320 0.1304
Steekproeven in R

Populatiestandaardafwijking gedeeld door wortel(n)

Steekproefgrootte Std.dev. steekproefgem. Berekening Resultaat
5 1.1929 2.68686 / sqrt(5) 1.2016
20 0.6028 2.68686 / sqrt(20) 0.6008
80 0.2865 2.68686 / sqrt(80) 0.3004
320 0.1304 2.68686 / sqrt(320) 0.1502
Steekproeven in R

Laten we oefenen!

Steekproeven in R

Preparing Video For Download...