Error relativo de estimaciones puntuales

Muestreo en Python

James Chapman

Curriculum Manager, DataCamp

El tamaño de muestra es el número de filas

len(coffee_ratings.sample(n=300))
300
len(coffee_ratings.sample(frac=0.25))
334
Muestreo en Python

Varios tamaños de muestra

coffee_ratings['total_cup_points'].mean()
82.15120328849028
coffee_ratings.sample(n=10)['total_cup_points'].mean()
83.027
coffee_ratings.sample(n=100)['total_cup_points'].mean()
82.4897
coffee_ratings.sample(n=1000)['total_cup_points'].mean()
82.1186
Muestreo en Python

Errores relativos

Parámetro poblacional:

population_mean = coffee_ratings['total_cup_points'].mean()

Estimación puntual:

sample_mean = coffee_ratings.sample(n=sample_size)['total_cup_points'].mean()

Error relativo en porcentaje:

rel_error_pct = 100 * abs(population_mean-sample_mean) / population_mean
Muestreo en Python

Error relativo vs. tamaño de muestra

import matplotlib.pyplot as plt
errors.plot(x="sample_size", 
            y="relative_error", 
            kind="line")
plt.show()

Propiedades:

  • Muy ruidoso, sobre todo con muestras pequeñas
  • La amplitud cae fuerte al inicio y luego se aplana
  • El error relativo tiende a cero (cuando tamaño de muestra = población)

Gráfico de líneas del error relativo frente al tamaño de muestra.

Muestreo en Python

¡Vamos a practicar!

Muestreo en Python

Preparing Video For Download...