Erreurs standard et théorème central limite

L’échantillonnage en Python

James Chapman

Curriculum Manager, DataCamp

Distribution d’échantillonnage des points de tasse moyens

Taille d’échantillon : 5 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de cinq.

Taille d’échantillon : 20 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de 20.

Taille d’échantillon : 80 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de 80.

Taille d’échantillon : 320 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de 320.

Conséquences du théorème central limite

Les moyennes d’échantillons indépendants suivent approximativement des lois normales.

Quand la taille d’échantillon augmente,

La distribution des moyennes devient plus proche de la normale
La largeur de la distribution d’échantillonnage devient plus étroite

Moyennes: population et distribution d’échantillonnage

coffee_ratings['total_cup_points'].mean()

82.15120328849028

Utilisez np.mean() sur chaque distribution d’échantillonnage approchée :

Taille d’échantillon	Moyenne des moyennes
5	`82.18420719999999`
20	`82.1558634`
80	`82.14510154999999`
320	`82.154017925`

Écarts-types: population et distribution d’échantillonnage

coffee_ratings['total_cup_points'].std(ddof=0)

2.685858187306438

Indiquez ddof=0 avec .std() pour une population
Indiquez ddof=1 avec np.std() pour des échantillons ou distributions d’échantillonnage

Taille d’échantillon	Écart-type de la moyenne
5	`1.1886358227738543`
20	`0.5940321141669805`
80	`0.2934024263916487`
320	`0.13095083089190876`

Population / racine carrée de la taille d’échantillon

Taille d’échantillon	Écart-type de la moyenne	Calcul	Résultat
5	`1.1886358227738543`	`2.685858187306438 / sqrt(5)`	`1.201`
20	`0.5940321141669805`	`2.685858187306438 / sqrt(20)`	`0.601`
80	`0.2934024263916487`	`2.685858187306438 / sqrt(80)`	`0.300`
320	`0.13095083089190876`	`2.685858187306438 / sqrt(320)`	`0.150`

Erreur standard

Écart-type de la distribution d’échantillonnage
Outil clé pour comprendre la variabilité d’échantillonnage

Passons à la pratique !

L’échantillonnage en Python