Interval kepercayaan bootstrap

Pemikiran Statistik dengan Python (Bagian 2)

Justin Bois

Lecturer at the California Institute of Technology

Fungsi replikasi bootstrap

def bootstrap_replicate_1d(data, func):
    """Generate bootstrap replicate of 1D data."""
    bs_sample = np.random.choice(data, len(data))
    return func(bs_sample)

bootstrap_replicate_1d(michelson_speed_of_light, np.mean)
299859.20000000001
bootstrap_replicate_1d(michelson_speed_of_light, np.mean)
299855.70000000001
bootstrap_replicate_1d(michelson_speed_of_light, np.mean)
299850.29999999999
Pemikiran Statistik dengan Python (Bagian 2)

Banyak replikasi bootstrap

bs_replicates = np.empty(10000)

for i in range(10000): bs_replicates[i] = bootstrap_replicate_1d( michelson_speed_of_light, np.mean)
Pemikiran Statistik dengan Python (Bagian 2)

Plot histogram replikasi bootstrap

_ = plt.hist(bs_replicates, bins=30, normed=True)
_ = plt.xlabel('mean speed of light (km/s)')
_ = plt.ylabel('PDF')
plt.show()
Pemikiran Statistik dengan Python (Bagian 2)

Estimasi rata-rata dengan bootstrap

ch2-2.011.png

Pemikiran Statistik dengan Python (Bagian 2)

Interval kepercayaan suatu statistik

  • Jika pengukuran diulang berkali-kali, p% nilai teramati akan berada dalam interval kepercayaan p%.
Pemikiran Statistik dengan Python (Bagian 2)

Interval kepercayaan bootstrap

conf_int = np.percentile(bs_replicates, [2.5, 97.5])
array([ 299837.,  299868.])

ch2-2.016.png

Pemikiran Statistik dengan Python (Bagian 2)

Ayo berlatih!

Pemikiran Statistik dengan Python (Bagian 2)

Preparing Video For Download...