Pengujian Hipotesis dengan Python
James Chapman
Curriculum Manager, DataCamp
age_first_code_cut mengklasifikasikan kapan pengguna Stack Overflow mulai ngoding"adult" artinya mulai usia 14 atau lebih"child" artinya mulai sebelum 14Sebuah hipotesis adalah pernyataan tentang parameter populasi yang tidak diketahui
Uji hipotesis menguji dua hipotesis yang bersaing
Hipotesis nol ($H_{0}$) adalah gagasan yang ada
Hipotesis alternatif ($H_{A}$) adalah gagasan penantang dari peneliti
Untuk masalah kita:
Tingkat signifikansi adalah padanan "melampaui keraguan wajar" pada uji hipotesis

Uji hipotesis memeriksa apakah statistik sampel berada di ekor sebaran nol
| Uji | Ekor |
|---|---|
| alternatif berbeda dari nol | dua ekor |
| alternatif lebih besar dari nol | ekor kanan |
| alternatif lebih kecil dari nol | ekor kiri |
$H_{A}$: Proporsi data scientist yang mulai ngoding saat anak-anak lebih besar dari 35%
Ini uji ber-eko kanan

p-value: probabilitas memperoleh hasil, dengan asumsi hipotesis nol benar
prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean()
0.39141972578505085
prop_child_hyp = 0.35
std_error = np.std(first_code_boot_distn, ddof=1)
0.010351057228878566
z_score = (prop_child_samp - prop_child_hyp) / std_error
4.001497129152506
norm.cdf() adalah CDF normal dari scipy.stats.norm.cdf().1 - norm.cdf().
from scipy.stats import norm
1 - norm.cdf(z_score, loc=0, scale=1)
3.1471479512323874e-05
Pengujian Hipotesis dengan Python