Sampling kemudahan

Sampling di R

Richie Cotton

Data Evangelist at DataCamp

Prediksi pemilu Literary Digest

Halaman depan Literary Digest tahun 1936 dengan tajuk prediksi pemilu. Landon diperkirakan mendapat 1,3 juta suara dan Roosevelt sedikit di bawah 1 juta suara.

  • Prediksi: Landon 57%; Roosevelt 43%
  • Hasil nyata: Landon 38%; Roosevelt 62%
  • Sampel tidak mewakili populasi, menimbulkan bias sampel.
  • Mengumpulkan data dengan cara termudah disebut convenience sampling.
Sampling di R

Mencari usia rata-rata penduduk Prancis

Foto Disneyland Paris.

  • Survei 10 orang di Disneyland Paris.
  • Rata-rata usia mereka 24,6 tahun.
  • Apakah ini perkiraan yang baik untuk seluruh Prancis?
1 Gambar oleh Sean MacEntee
Sampling di R

Seberapa akurat surveinya?

Tahun Usia Rata-rata Prancis
1975 31,6
1985 33,6
1995 36,2
2005 38,9
2015 41,2
  • 24,6 tahun adalah perkiraan yang buruk.
  • Pengunjung Disneyland tidak mewakili seluruh populasi.
Sampling di R

Sampling kemudahan pada penilaian kopi

coffee_ratings %>% 
  summarize(mean_cup_points = mean(total_cup_points))
  mean_cup_points
1           82.09
coffee_ratings_first10 <- coffee_ratings %>% 
  slice_head(n = 10)
coffee_ratings_first10 %>% 
  summarize(mean_cup_points = mean(total_cup_points))
  mean_cup_points
1            89.1
Sampling di R

Memvisualisasikan bias seleksi

coffee_ratings %>%
  ggplot(aes(x = total_cup_points)) +
  geom_histogram(binwidth = 2)

Histogram poin cangkir dari populasi.

coffee_ratings_first10 %>%
  ggplot(aes(x = total_cup_points)) +
  geom_histogram(binwidth = 2) +
  xlim(59, 91)

Histogram poin cangkir dari sampel.

Sampling di R

Memvisualisasikan bias seleksi 2

coffee_ratings %>%
  ggplot(aes(x = total_cup_points)) +
  geom_histogram(binwidth = 2) 

Histogram poin cangkir dari populasi.

coffee_ratings %>%
  slice_sample(n = 10) %>% 
  ggplot(aes(x = total_cup_points)) +
  geom_histogram(binwidth = 2) +
  xlim(59, 91)

Histogram poin cangkir dari sampel acak.

Sampling di R

Ayo berlatih!

Sampling di R

Preparing Video For Download...