Erreurs standard et théorème central limite

L’échantillonnage en Python

James Chapman

Curriculum Manager, DataCamp

Distribution d’échantillonnage des points de tasse moyens

Taille d’échantillon : 5 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de cinq.

Taille d’échantillon : 20 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de 20.

Taille d’échantillon : 80 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de 80.

Taille d’échantillon : 320 Histogramme de l’approximation de la distribution d’échantillonnage des points de tasse moyens avec une taille d’échantillon de 320.

L’échantillonnage en Python

Conséquences du théorème central limite

 

Les moyennes d’échantillons indépendants suivent approximativement des lois normales.

 

Quand la taille d’échantillon augmente,

  • La distribution des moyennes devient plus proche de la normale

  • La largeur de la distribution d’échantillonnage devient plus étroite

L’échantillonnage en Python

Moyennes: population et distribution d’échantillonnage

coffee_ratings['total_cup_points'].mean()
82.15120328849028

Utilisez np.mean() sur chaque distribution d’échantillonnage approchée :

Taille d’échantillon Moyenne des moyennes
5 82.18420719999999
20 82.1558634
80 82.14510154999999
320 82.154017925
L’échantillonnage en Python

Écarts-types: population et distribution d’échantillonnage

coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438

 

  • Indiquez ddof=0 avec .std() pour une population
  • Indiquez ddof=1 avec np.std() pour des échantillons ou distributions d’échantillonnage
Taille d’échantillon Écart-type de la moyenne
5 1.1886358227738543
20 0.5940321141669805
80 0.2934024263916487
320 0.13095083089190876
L’échantillonnage en Python

Population / racine carrée de la taille d’échantillon

Taille d’échantillon Écart-type de la moyenne Calcul Résultat
5 1.1886358227738543 2.685858187306438 / sqrt(5) 1.201
20 0.5940321141669805 2.685858187306438 / sqrt(20) 0.601
80 0.2934024263916487 2.685858187306438 / sqrt(80) 0.300
320 0.13095083089190876 2.685858187306438 / sqrt(320) 0.150
L’échantillonnage en Python

Erreur standard

  • Écart-type de la distribution d’échantillonnage
  • Outil clé pour comprendre la variabilité d’échantillonnage
L’échantillonnage en Python

Passons à la pratique !

L’échantillonnage en Python

Preparing Video For Download...