Python'da Hipotez Testi
James Chapman
Curriculum Manager, DataCamp
age_first_code_cut, Stack Overflow kullanıcısının ilk ne zaman programlamaya başladığını sınıflandırır"adult" 14 veya daha büyük yaşta başladığı anlamına gelir"child" 14’ten önce başladığı anlamına gelirBir hipotez, bilinmeyen bir anakütle parametresi hakkında bir ifadedir
Bir hipotez testi, iki rakip hipotezin testidir
Sıfır hipotezi ($H_{0}$) mevcut görüştür
Alternatif hipotez ($H_{A}$) araştırmacının yeni "meydan okuyucu" görüşüdür
Bizim problemimiz için:
Anlamlılık düzeyi, hipotez testinde "makul şüphenin ötesi" eşiğidir
Hipotez testleri, örnek istatistiğinin sıfır dağılımının kuyruklarında olup olmadığını kontrol eder
| Test | Kuyruklar |
|---|---|
| alternatif sıfırdan farklı | iki kuyruklu |
| alternatif sıfırdan büyük | sağ kuyruklu |
| alternatif sıfırdan küçük | sol kuyruklu |
$H_{A}$: Çocukken programlamaya başlayan veri bilimcilerin oranı %35’ten büyüktür
Bu sağ kuyruklu bir testtir

p-değerleri: sıfır hipotezi doğru kabul edilirse bir sonucun elde edilme olasılığı
prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean()
0.39141972578505085
prop_child_hyp = 0.35
std_error = np.std(first_code_boot_distn, ddof=1)
0.010351057228878566
z_score = (prop_child_samp - prop_child_hyp) / std_error
4.001497129152506
norm.cdf(), scipy.stats içindeki normal KDF’dir.norm.cdf() kullanın.1 - norm.cdf() kullanın.
from scipy.stats import norm
1 - norm.cdf(z_score, loc=0, scale=1)
3.1471479512323874e-05
Python'da Hipotez Testi