Relative Fehler von Punktschätzern

Stichprobenziehung in Python

James Chapman

Curriculum Manager, DataCamp

Stichprobengröße = Zeilenanzahl

len(coffee_ratings.sample(n=300))
300
len(coffee_ratings.sample(frac=0.25))
334
Stichprobenziehung in Python

Verschiedene Stichprobengrößen

coffee_ratings['total_cup_points'].mean()
82.15120328849028
coffee_ratings.sample(n=10)['total_cup_points'].mean()
83.027
coffee_ratings.sample(n=100)['total_cup_points'].mean()
82.4897
coffee_ratings.sample(n=1000)['total_cup_points'].mean()
82.1186
Stichprobenziehung in Python

Relative Fehler

Populationsparameter:

population_mean = coffee_ratings['total_cup_points'].mean()

Punktschätzer:

sample_mean = coffee_ratings.sample(n=sample_size)['total_cup_points'].mean()

Relativer Fehler in Prozent:

rel_error_pct = 100 * abs(population_mean-sample_mean) / population_mean
Stichprobenziehung in Python

Relativer Fehler vs. Stichprobengröße

import matplotlib.pyplot as plt
errors.plot(x="sample_size", 
            y="relative_error", 
            kind="line")
plt.show()

Eigenschaften:

  • Sehr rauschig, v. a. bei kleinen Stichproben
  • Amplitude fällt zuerst stark, dann flacht sie ab
  • Relativer Fehler geht gegen 0 (wenn Stichprobengröße = Population)

Liniendiagramm: relativer Fehler vs. Stichprobengröße.

Stichprobenziehung in Python

Lass uns üben!

Stichprobenziehung in Python

Preparing Video For Download...