Standaardfouten en de Centrale Limietstelling

Steekproeven in Python

James Chapman

Curriculum Manager, DataCamp

Steekproeftrekkingsverdeling van gemiddelde cup-punten

Steekproefgrootte: 5 Een histogram van de benaderde steekproeftrekkingsverdeling van gemiddelde cup-punten bij steekproefgrootte 5.

Steekproefgrootte: 20 Een histogram van de benaderde steekproeftrekkingsverdeling van gemiddelde cup-punten bij steekproefgrootte 20.

Steekproefgrootte: 80 Een histogram van de benaderde steekproeftrekkingsverdeling van gemiddelde cup-punten bij steekproefgrootte 80.

Steekproefgrootte: 320 Een histogram van de benaderde steekproeftrekkingsverdeling van gemiddelde cup-punten bij steekproefgrootte 320.

Steekproeven in Python

Gevolgen van de centrale limietstelling

 

Gemiddelden van onafhankelijke steekproeven zijn benaderend normaal verdeeld.

 

Als de steekproefgrootte toeneemt,

  • Wordt de verdeling van de gemiddelden meer normaal

  • Wordt de breedte van de steekproeftrekkingsverdeling kleiner

Steekproeven in Python

Populatie- en steekproeftrekkingsgemiddelden

coffee_ratings['total_cup_points'].mean()
82.15120328849028

Gebruik np.mean() op elke benaderde steekproeftrekkingsverdeling:

Steekproefgrootte Gemiddelde steekproefgemiddelde
5 82.18420719999999
20 82.1558634
80 82.14510154999999
320 82.154017925
Steekproeven in Python

Populatie- en steekproeftrekkings-std.dev.

coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438

 

  • Geef ddof=0 op bij .std() voor populaties
  • Geef ddof=1 op bij np.std() voor steekproeven of steekproeftrekkingsverdelingen
Steekproefgrootte Std.dev. steekproefgemiddelde
5 1.1886358227738543
20 0.5940321141669805
80 0.2934024263916487
320 0.13095083089190876
Steekproeven in Python

Populatiestandaarddeviatie gedeeld door √(n)

Steekproefgrootte Std.dev. steekproefgemiddelde Berekening Resultaat
5 1.1886358227738543 2.685858187306438 / sqrt(5) 1.201
20 0.5940321141669805 2.685858187306438 / sqrt(20) 0.601
80 0.2934024263916487 2.685858187306438 / sqrt(80) 0.300
320 0.13095083089190876 2.685858187306438 / sqrt(320) 0.150
Steekproeven in Python

Standaardfout

  • Standaarddeviatie van de steekproeftrekkingsverdeling
  • Belangrijk om steekproefvariatie te begrijpen
Steekproeven in Python

Laten we oefenen!

Steekproeven in Python

Preparing Video For Download...