R ile Hipotez Testi
Richie Cotton
Data Evangelist at DataCamp
age_first_code_cut, Stack Overflow kullanıcısının programlamaya ilk ne zaman başladığını sınıflandırır"adult" 14 yaş ve üstü başladığını belirtir"child" 14 yaşından önce başladığını belirtirBir hipotez, bilinmeyen bir anakütle parametresi hakkında bir ifadedir.
Bir hipotez testi, iki rakip hipotezin sınanmasıdır.
Sıfır hipotezi ($H_{0}$) mevcut “şampiyon” fikirdir.
Alternatif hipotez ($H_{A}$) araştırmacının yeni “rakip” fikridir.
Sorunumuz için
Anlamlılık düzeyi, hipotez testinde “makul şüphenin ötesi” eşiğidir.

Hipotez testleri, örnek istatistiğinin sıfır dağılımının kuyruklarında olup olmadığını belirler.
| Test | Kuyruklar |
|---|---|
| alternatif sıfırdan farklı | iki kuyruk |
| alternatif sıfırdan büyük | sağ kuyruk |
| alternatif sıfırdan küçük | sol kuyruk |
$H_{A}$: Çocukken programlamaya başlayan veri bilimcilerin oranı %35’ten büyüktür.
Alternatif hipotezimiz “büyüktür” dediği için sağ kuyruklu test gerekir.
Bir p-değeri,
sınama istatistiğini gözlemleme olasılığıdır;
en az bu kadar uç ya da daha uç olanı
orijinal örneğimizde gördüğümüzden,
sıfır hipotezinin doğru olduğu varsayımıyla.
prop_child_samp <- stack_overflow %>%
summarize(point_estimate = mean(age_first_code_cut == "child")) %>%
pull(point_estimate)
0.388
prop_child_hyp <- 0.35
std_error <- 0.0096028
z_score <- (prop_child_samp - prop_child_hyp) / std_error
3.956
pnorm() normal KDF’dir.lower.tail = TRUE.lower.tail = FALSE ayarlayın.
p_value <- pnorm(z_score, lower.tail = FALSE)
3.818e-05
R ile Hipotez Testi