Gelegenheitsstichprobe

Stichprobenziehung in Python

James Chapman

Curriculum Manager, DataCamp

Die Wahlprognose des Literary Digest

Titelseite des Literary Digest von 1936 mit Wahlprognose: Landon soll 1,3 Mio. Stimmen erhalten, Roosevelt knapp unter 1 Mio.

  • Prognose: Landon 57 %, Roosevelt 43 %
  • Ergebnis: Landon 38 %, Roosevelt 62 %
  • Stichprobe nicht repräsentativ → Stichprobenverzerrung
  • Daten auf dem bequemsten Weg erheben = Gelegenheitsstichprobe
Stichprobenziehung in Python

Das Durchschnittsalter der Franzosen ermitteln

Ein Foto von Disneyland Paris.

  • 10 Personen in Disneyland Paris befragen
  • Durchschnittsalter: 24,6 Jahre
  • Ist das eine gute Schätzung für ganz Frankreich?
1 Bild von Sean MacEntee
Stichprobenziehung in Python

Wie genau war die Umfrage?

Jahr Durchschnittsalter in Frankreich
1975 31,6
1985 33,6
1995 36,2
2005 38,9
2015 41,2
  • 24,6 Jahre ist eine schlechte Schätzung
  • Disneyland-Besucher sind nicht repräsentativ für die Bevölkerung
Stichprobenziehung in Python

Gelegenheitsstichprobe bei Kaffeebewertungen

coffee_ratings["total_cup_points"].mean()
82.15120328849028
coffee_ratings_first10 = coffee_ratings.head(10)
coffee_ratings_first10["total_cup_points"].mean()
89.1
Stichprobenziehung in Python

Auswahlverzerrung visualisieren

import matplotlib.pyplot as plt
import numpy as np
coffee_ratings["total_cup_points"].hist(bins=np.arange(59, 93, 2))
plt.show()

 

coffee_ratings_first10["total_cup_points"].hist(bins=np.arange(59, 93, 2))
plt.show()
Stichprobenziehung in Python

Verteilung der Grundgesamtheit vs. Gelegenheitsstichprobe

Grundgesamtheit: Ein Histogramm der Cup Points aus der Grundgesamtheit.

Gelegenheitsstichprobe: Ein Histogramm der Cup Points aus der Stichprobe.

Stichprobenziehung in Python

Auswahlverzerrung bei einer Zufallsstichprobe visualisieren

coffee_sample = coffee_ratings.sample(n=10)
coffee_sample["total_cup_points"].hist(bins=np.arange(59, 93, 2))
plt.show()
Stichprobenziehung in Python

Verteilung der Grundgesamtheit vs. einfache Zufallsstichprobe

Grundgesamtheit: Ein Histogramm der Cup Points aus der Grundgesamtheit.

Zufallsstichprobe: Ein Histogramm der Cup Points aus einer Zufallsstichprobe.

Stichprobenziehung in Python

Lass uns üben!

Stichprobenziehung in Python

Preparing Video For Download...