Amostragem em Python
James Chapman
Curriculum Manager, DataCamp
Tamanho da amostra: 5

Tamanho da amostra: 20

Tamanho da amostra: 80

Tamanho da amostra: 320

Médias de amostras independentes têm distribuições aproximadamente normais.
Conforme o tamanho da amostra aumenta,
A distribuição das médias fica mais próxima da normal
A largura da distribuição amostral fica menor
coffee_ratings['total_cup_points'].mean()
82.15120328849028
Use np.mean() em cada distribuição amostral aproximada:
| Tamanho da amostra | Média da média amostral |
|---|---|
| 5 | 82.18420719999999 |
| 20 | 82.1558634 |
| 80 | 82.14510154999999 |
| 320 | 82.154017925 |
coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438
ddof=0 ao chamar .std() para populaçõesddof=1 ao chamar np.std() para amostras ou distribuições amostrais| Tamanho da amostra | Desv. pad. da média amostral |
|---|---|
| 5 | 1.1886358227738543 |
| 20 | 0.5940321141669805 |
| 80 | 0.2934024263916487 |
| 320 | 0.13095083089190876 |
| Tamanho da amostra | Desv. pad. da média amostral | Cálculo | Resultado |
|---|---|---|---|
| 5 | 1.1886358227738543 |
2.685858187306438 / sqrt(5) |
1.201 |
| 20 | 0.5940321141669805 |
2.685858187306438 / sqrt(20) |
0.601 |
| 80 | 0.2934024263916487 |
2.685858187306438 / sqrt(80) |
0.300 |
| 320 | 0.13095083089190876 |
2.685858187306438 / sqrt(320) |
0.150 |
Amostragem em Python