L’échantillonnage en Python
James Chapman
Curriculum Manager, DataCamp
Taille d’échantillon : 5

Taille d’échantillon : 20

Taille d’échantillon : 80

Taille d’échantillon : 320

Les moyennes d’échantillons indépendants suivent approximativement des lois normales.
Quand la taille d’échantillon augmente,
La distribution des moyennes devient plus proche de la normale
La largeur de la distribution d’échantillonnage devient plus étroite
coffee_ratings['total_cup_points'].mean()
82.15120328849028
Utilisez np.mean() sur chaque distribution d’échantillonnage approchée :
| Taille d’échantillon | Moyenne des moyennes |
|---|---|
| 5 | 82.18420719999999 |
| 20 | 82.1558634 |
| 80 | 82.14510154999999 |
| 320 | 82.154017925 |
coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438
ddof=0 avec .std() pour une populationddof=1 avec np.std() pour des échantillons ou distributions d’échantillonnage| Taille d’échantillon | Écart-type de la moyenne |
|---|---|
| 5 | 1.1886358227738543 |
| 20 | 0.5940321141669805 |
| 80 | 0.2934024263916487 |
| 320 | 0.13095083089190876 |
| Taille d’échantillon | Écart-type de la moyenne | Calcul | Résultat |
|---|---|---|---|
| 5 | 1.1886358227738543 |
2.685858187306438 / sqrt(5) |
1.201 |
| 20 | 0.5940321141669805 |
2.685858187306438 / sqrt(20) |
0.601 |
| 80 | 0.2934024263916487 |
2.685858187306438 / sqrt(80) |
0.300 |
| 320 | 0.13095083089190876 |
2.685858187306438 / sqrt(320) |
0.150 |
L’échantillonnage en Python