Erro relativo de estimativas pontuais

Amostragem em Python

James Chapman

Curriculum Manager, DataCamp

Tamanho da amostra é o nº de linhas

len(coffee_ratings.sample(n=300))
300
len(coffee_ratings.sample(frac=0.25))
334
Amostragem em Python

Vários tamanhos de amostra

coffee_ratings['total_cup_points'].mean()
82.15120328849028
coffee_ratings.sample(n=10)['total_cup_points'].mean()
83.027
coffee_ratings.sample(n=100)['total_cup_points'].mean()
82.4897
coffee_ratings.sample(n=1000)['total_cup_points'].mean()
82.1186
Amostragem em Python

Erros relativos

Parâmetro da população:

population_mean = coffee_ratings['total_cup_points'].mean()

Estimativa pontual:

sample_mean = coffee_ratings.sample(n=sample_size)['total_cup_points'].mean()

Erro relativo em porcentagem:

rel_error_pct = 100 * abs(population_mean-sample_mean) / population_mean
Amostragem em Python

Erro relativo vs. tamanho da amostra

import matplotlib.pyplot as plt
errors.plot(x="sample_size", 
            y="relative_error", 
            kind="line")
plt.show()

Propriedades:

  • Muito ruidoso, especialmente em amostras pequenas
  • Amplitude cai rápido e depois achata
  • Erro relativo vai a zero (quando tamanho da amostra = população)

Gráfico de linha do erro relativo versus tamanho da amostra.

Amostragem em Python

Vamos praticar!

Amostragem em Python

Preparing Video For Download...