Sampling klaster

Sampling di R

Richie Cotton

Data Evangelist at DataCamp

Sampling berstrata vs. sampling klaster

Sampling berstrata

  • Bagi populasi menjadi subkelompok
  • Gunakan simple random sampling pada setiap subkelompok

Sampling klaster

  • Gunakan simple random sampling untuk memilih beberapa subkelompok
  • Gunakan simple random sampling hanya pada subkelompok terpilih
Sampling di R

Ragam kopi

Biji kopi tersusun dalam baris dan kolom.

varieties_pop <- unique(
  coffee_ratings$variety
)
 [1] "Bourbon"              
 [2] "Catimor"              
 [3] "Ethiopian Yirgacheffe"
 [4] "Caturra"              
 [5] "SL14"  
...
[27] "Marigojipe"           
[28] "Pache Comun"
Sampling di R

Tahap 1: sampling subkelompok

Biji kopi tersusun baris–kolom, semua diarsir abu-abu kecuali tiga.

varieties_samp <- sample(
  varieties_pop, 
  size = 3
)
"Sumatra"       "Blue Mountain" "SL28"
Sampling di R

Tahap 2: sampling tiap kelompok

coffee_ratings %>% 
  filter(variety %in% varieties_samp) %>% 
  group_by(variety) %>% 
  slice_sample(n = 5) %>% 
  ungroup()
Sampling di R

Keluaran tahap 2

# A tibble: 10 x 8
   total_cup_points variety       country_of_origin aroma flavor aftertaste  body balance
              <dbl> <chr>         <chr>             <dbl>  <dbl>      <dbl> <dbl>   <dbl>
 1             81.5 Blue Mountain Haiti              7.42   7.33       7.25  7.42    7.33
 2             82.7 Blue Mountain Mexico             7.75   7.58       7.25  7.67    7.58
 3             84.5 SL28          Kenya              7.92   7.83       7.67  7.67    7.75
 4             81.9 SL28          Zambia             7.67   7.08       7.42  7.75    7.42
 5             84.7 SL28          Kenya              7.75   7.92       7.83  7.58    7.75
 6             85.5 SL28          Kenya              7.92   7.92       7.83  7.83    7.92
 7             83.8 SL28          Kenya              7.75   7.58       7.5   7.75    7.75
 8             86.6 Sumatra       Taiwan             8      8          8     8       8.17
 9             81.7 Sumatra       Indonesia          7.17   7.42       7.33  7.33    7.42
10             83.5 Sumatra       Indonesia          7.25   7.67       7.58  7.83    7.58
Sampling di R

Sampling bertahap

  • Sampling klaster adalah jenis sampling bertahap.
  • Bisa > 2 tahap.
  • Survei nasional bisa men-sample provinsi, kabupaten/kota, dan kecamatan/kelurahan.
Sampling di R

Ayo berlatih!

Sampling di R

Preparing Video For Download...