Muestreo en Python
James Chapman
Curriculum Manager, DataCamp
Tamaño de muestra: 5

Tamaño de muestra: 20

Tamaño de muestra: 80

Tamaño de muestra: 320

Las medias de muestras independientes tienen distribuciones aproximadamente normales.
A medida que crece el tamaño muestral,
La distribución de las medias se acerca a la normalidad
La anchura de la distribución muestral se vuelve más estrecha
coffee_ratings['total_cup_points'].mean()
82.15120328849028
Usa np.mean() en cada distribución muestral aproximada:
| Tamaño de muestra | Media de la media muestral |
|---|---|
| 5 | 82.18420719999999 |
| 20 | 82.1558634 |
| 80 | 82.14510154999999 |
| 320 | 82.154017925 |
coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438
ddof=0 al llamar a .std() en poblacionesddof=1 al llamar a np.std() en muestras o distribuciones muestrales| Tamaño de muestra | Desv. típ. de la media muestral |
|---|---|
| 5 | 1.1886358227738543 |
| 20 | 0.5940321141669805 |
| 80 | 0.2934024263916487 |
| 320 | 0.13095083089190876 |
| Tamaño de muestra | Desv. típ. de la media muestral | Cálculo | Resultado |
|---|---|---|---|
| 5 | 1.1886358227738543 |
2.685858187306438 / sqrt(5) |
1.201 |
| 20 | 0.5940321141669805 |
2.685858187306438 / sqrt(20) |
0.601 |
| 80 | 0.2934024263916487 |
2.685858187306438 / sqrt(80) |
0.300 |
| 320 | 0.13095083089190876 |
2.685858187306438 / sqrt(320) |
0.150 |
Muestreo en Python