Bootstrap berpasangan

Pemikiran Statistik dengan Python (Bagian 2)

Justin Bois

Lecturer at the California Institute of Technology

Inferensi nonparametrik

  • Jangan berasumsi tentang model atau distribusi peluang yang mendasari data
Pemikiran Statistik dengan Python (Bagian 2)

Hasil pemilu negara swing AS 2008

Hasil pemilu negara swing AS 2008

1 Data diambil dari Data.gov (https://www.data.gov/)
Pemikiran Statistik dengan Python (Bagian 2)

Bootstrap berpasangan untuk regresi linear

  • Ambil sampel ulang data secara berpasangan
  • Hitung kemiringan dan intersep dari data hasil sampel ulang
  • Tiap kemiringan dan intersep adalah replikasi bootstrap
  • Hitung interval kepercayaan dari persentil replikasi bootstrap
Pemikiran Statistik dengan Python (Bagian 2)

Membuat sampel bootstrap berpasangan

np.arange(7)
array([0, 1, 2, 3, 4, 5, 6])
inds = np.arange(len(total_votes))

bs_inds = np.random.choice(inds, len(inds))
bs_total_votes = total_votes[bs_inds] bs_dem_share = dem_share[bs_inds]
Pemikiran Statistik dengan Python (Bagian 2)

Menghitung replikasi bootstrap berpasangan

bs_slope, bs_intercept = np.polyfit(bs_total_votes, 
                                    bs_dem_share, 1)

bs_slope, bs_intercept
(3.9053605692223672e-05, 40.387910131803025)
np.polyfit(total_votes, dem_share, 1)  # fit of original
array([  4.03707170e-05,   4.01139120e+01])
Pemikiran Statistik dengan Python (Bagian 2)

Hasil pemilu negara swing AS 2008

Hasil pemilu negara swing AS 2008

1 Data diambil dari Data.gov (https://www.data.gov/)
Pemikiran Statistik dengan Python (Bagian 2)

Ayo berlatih!

Pemikiran Statistik dengan Python (Bagian 2)

Preparing Video For Download...