Erros padrão e o Teorema Central do Limite

Amostragem em Python

James Chapman

Curriculum Manager, DataCamp

Distribuição amostral dos pontos médios da xícara

Tamanho da amostra: 5 Um histograma da distribuição amostral aproximada dos pontos médios da xícara com tamanho de amostra 5.

Tamanho da amostra: 20 Um histograma da distribuição amostral aproximada dos pontos médios da xícara com tamanho de amostra 20.

Tamanho da amostra: 80 Um histograma da distribuição amostral aproximada dos pontos médios da xícara com tamanho de amostra 80.

Tamanho da amostra: 320 Um histograma da distribuição amostral aproximada dos pontos médios da xícara com tamanho de amostra 320.

Amostragem em Python

Consequências do teorema central do limite

 

Médias de amostras independentes têm distribuições aproximadamente normais.

 

Conforme o tamanho da amostra aumenta,

  • A distribuição das médias fica mais próxima da normal

  • A largura da distribuição amostral fica menor

Amostragem em Python

Médias: população e distribuição amostral

coffee_ratings['total_cup_points'].mean()
82.15120328849028

Use np.mean() em cada distribuição amostral aproximada:

Tamanho da amostra Média da média amostral
5 82.18420719999999
20 82.1558634
80 82.14510154999999
320 82.154017925
Amostragem em Python

Desvios-padrão: população e distribuição amostral

coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438

 

  • Use ddof=0 ao chamar .std() para populações
  • Use ddof=1 ao chamar np.std() para amostras ou distribuições amostrais
Tamanho da amostra Desv. pad. da média amostral
5 1.1886358227738543
20 0.5940321141669805
80 0.2934024263916487
320 0.13095083089190876
Amostragem em Python

Desvio-população sobre raiz do tamanho da amostra

Tamanho da amostra Desv. pad. da média amostral Cálculo Resultado
5 1.1886358227738543 2.685858187306438 / sqrt(5) 1.201
20 0.5940321141669805 2.685858187306438 / sqrt(20) 0.601
80 0.2934024263916487 2.685858187306438 / sqrt(80) 0.300
320 0.13095083089190876 2.685858187306438 / sqrt(320) 0.150
Amostragem em Python

Erro padrão

  • Desvio-padrão da distribuição amostral
  • Ferramenta importante para entender a variabilidade amostral
Amostragem em Python

Vamos praticar!

Amostragem em Python

Preparing Video For Download...