Sampling kenyamanan

Sampling di Python

James Chapman

Curriculum Manager, DataCamp

Prediksi pemilu oleh The Literary Digest

Halaman depan Literary Digest tahun 1936 dengan tajuk prediksi pemilu. Landon diperkirakan mendapat 1,3 juta suara, dan Roosevelt sedikit di bawah 1 juta suara.

  • Prediksi: Landon 57%; Roosevelt 43%
  • Hasil nyata: Landon 38%; Roosevelt 62%
  • Sampel tidak mewakili populasi, menimbulkan bias sampel
  • Mengumpulkan data dengan cara termudah disebut sampling kenyamanan
Sampling di Python

Mencari usia rata-rata orang Prancis

Foto Disneyland Paris.

  • Survei 10 orang di Disneyland Paris
  • Rata-rata usia 24,6 tahun
  • Apakah ini estimasi yang baik untuk seluruh Prancis?
1 Gambar oleh Sean MacEntee
Sampling di Python

Seberapa akurat surveinya?

Tahun Usia Rata-rata Prancis
1975 31.6
1985 33.6
1995 36.2
2005 38.9
2015 41.2
  • 24,6 tahun adalah estimasi yang buruk
  • Pengunjung Disneyland tidak mewakili seluruh populasi
Sampling di Python

Sampling kenyamanan pada penilaian kopi

coffee_ratings["total_cup_points"].mean()
82.15120328849028
coffee_ratings_first10 = coffee_ratings.head(10)
coffee_ratings_first10["total_cup_points"].mean()
89.1
Sampling di Python

Memvisualisasikan bias seleksi

import matplotlib.pyplot as plt
import numpy as np
coffee_ratings["total_cup_points"].hist(bins=np.arange(59, 93, 2))
plt.show()

 

coffee_ratings_first10["total_cup_points"].hist(bins=np.arange(59, 93, 2))
plt.show()
Sampling di Python

Distribusi populasi vs. sampel kenyamanan

Populasi: Histogram poin cangkir dari populasi.

Sampel kenyamanan: Histogram poin cangkir dari sampel.

Sampling di Python

Memvisualisasikan bias seleksi untuk sampel acak

coffee_sample = coffee_ratings.sample(n=10)
coffee_sample["total_cup_points"].hist(bins=np.arange(59, 93, 2))
plt.show()
Sampling di Python

Distribusi populasi vs. sampel acak sederhana

Populasi: Histogram poin cangkir dari populasi.

Sampel acak: Histogram poin cangkir dari sampel acak.

Sampling di Python

Ayo berlatih!

Sampling di Python

Preparing Video For Download...