Criando uma distribuição amostral

Amostragem em Python

James Chapman

Curriculum Manager, DataCamp

Mesmo código, resposta diferente

coffee_ratings.sample(n=30)['total_cup_points'].mean()
82.53066666666668
coffee_ratings.sample(n=30)['total_cup_points'].mean()
81.97566666666667
coffee_ratings.sample(n=30)['total_cup_points'].mean()
82.68
coffee_ratings.sample(n=30)['total_cup_points'].mean()
81.675
Amostragem em Python

Mesmo código, 1000 vezes

mean_cup_points_1000 = []

for i in range(1000): mean_cup_points_1000.append( coffee_ratings.sample(n=30)['total_cup_points'].mean() )
print(mean_cup_points_1000)
[82.11933333333333, 82.55300000000001, 82.07266666666668, 81.76966666666667, 
...
 82.74166666666666, 82.45033333333335, 81.77199999999999, 82.8163333333333]
Amostragem em Python

Distribuição das médias (n = 30)

import matplotlib.pyplot as plt
plt.hist(mean_cup_points_1000, bins=30)
plt.show()

Uma distribuição amostral é a distribuição de réplicas de estimativas pontuais.

Um histograma de médias amostrais.

Amostragem em Python

Tamanhos de amostra diferentes

Tamanho da amostra: 6

Um histograma de médias amostrais com tamanho de amostra 6.

Tamanho da amostra: 150

Um histograma de médias amostrais com tamanho de amostra 150.

Amostragem em Python

Vamos praticar!

Amostragem em Python

Preparing Video For Download...