Pengambilan Sampel Acak Berstrata

Menganalisis Data Survei di Python

EbunOluwa Andrew

Data Scientist

Apa itu pengambilan sampel acak berstrata

  • Sampel berstrata lebih mencerminkan populasi
  • Teknik membagi populasi ke unit diskret (strata) berdasarkan atribut serupa
  • Melakukan pengambilan ulang agar proporsi sesuai populasi

Perubahan demografi saat kelompok besar orang berubah keanekaragaman dalam populasi

Menganalisis Data Survei di Python

Mengapa memakai sampel acak berstrata?

  • Meminimalkan bias seleksi
  • Meningkatkan keterwakilan kelompok tertentu
  • Contoh:
    • Estimasi pendapatan untuk populasi beragam
    • Estimasi hasil jajak pendapat
    • Estimasi harapan hidup

Penghitung genggam menghitung jumlah orang

Menganalisis Data Survei di Python

Kapan tidak memakai sampel acak berstrata

  • Subkelompok tidak boleh tumpang tindih
    • Subjek yang masuk beberapa grup -> salah wakil
  • Contoh tumpang tindih pada pertanyaan survei
    • Berapa lama Anda bekerja di pekerjaan saat ini?
      • 1–2 tahun
      • 2–4 tahun

wanita sedang berpikir

Menganalisis Data Survei di Python

Hasil survei kerja di kantor di perusahaan ABC

| employee_id | gender | onsite_work |
|-------------|--------|-------------|
|    fffe6838 | Male   | Yes         |
|   fffe12184 | Female | Yes         |
|    fffe9404 | Female | Yes         |
|   fffe17578 | Male   | Yes         |
|   fffe22257 | Female | Yes         |
|    fffe6217 | Male   | Yes         |
|    fffe7828 | Female | Yes         |
|   fffe18192 | Male   | Yes         |
|    fffe2839 | Female | Yes         |
|   fffe16173 | Female | Yes         |

Menganalisis Data Survei di Python

Cek proporsi pada populasi

survey.gender.value_counts(normalize=True)
Female    0.556
Male      0.444
Name: gender, dtype: float64
Menganalisis Data Survei di Python

Plot proporsi pada populasi

import pandas as pd
import matplotlib.pyplot as plt

survey.gender.value_counts().plot.pie()

Rasio perempuan ke laki-laki pada survei

Menganalisis Data Survei di Python

Contoh sampel berstrata

strat_sample = 
survey.groupby(
  'gender', group_keys = False).apply(
  lambda x: x.sample(frac = 0.1))
| employee_id | gender | onsite_work |
|-------------|--------|-------------|
|    fffe4934 | Female | Yes         |
|    fffe3958 | Female | Yes         |
|      fffe18 | Female | Yes         |
|     fffe283 | Female | Yes         |
|   fffe20382 | Female | Yes         |
|    fffe8721 | Male   | Yes         |
|    fffe5955 | Male   | Yes         |
|    fffe7081 | Male   | Yes         |
|     fffe353 | Male   | Yes         |
|    fffe1765 | Male   | Yes         |

Menganalisis Data Survei di Python

Cek proporsi pada sampel

Populasi asli

survey.gender.value_counts(normalize=True)

Sampel berstrata

strat_sample.gender.value_counts(
  normalize=True))
Female    0.556
Male      0.444
Name: gender, dtype: float64
Female    0.56
Male      0.44
Name: gender, dtype: float64
Menganalisis Data Survei di Python

Ayo berlatih!

Menganalisis Data Survei di Python

Preparing Video For Download...