Pengujian Hipotesis di R
Richie Cotton
Data Evangelist at DataCamp
age_first_code_cut mengklasifikasikan kapan pengguna Stack Overflow mulai ngoding"adult" berarti mulai usia 14 atau lebih"child" berarti mulai sebelum 14Hipotesis adalah pernyataan tentang parameter populasi yang tidak diketahui.
Uji hipotesis menguji dua hipotesis yang bersaing.
Hipotesis nol ($H_{0}$) adalah gagasan "juara" yang ada.
Hipotesis alternatif ($H_{A}$) adalah gagasan "penantang" dari peneliti.
Untuk masalah kita
Tingkat signifikansi adalah padanan "melampaui keraguan wajar" dalam uji hipotesis.

Uji hipotesis menilai apakah statistik sampel jatuh di ekor sebaran nol.
| Uji | Ekor |
|---|---|
| alternatif berbeda dari nol | dua ekor |
| alternatif lebih besar dari nol | ekor kanan |
| alternatif kurang dari nol | ekor kiri |
$H_{A}$: Proporsi data scientist yang mulai ngoding saat anak-anak lebih besar dari 35%.
Karena alternatif memakai "lebih besar", kita perlu uji ekor kanan.
p-value adalah
probabilitas mengamati statistik uji
setidaknya sesekstrem
dengan yang terlihat pada sampel awal kita,
dengan asumsi hipotesis nol benar.
prop_child_samp <- stack_overflow %>%
summarize(point_estimate = mean(age_first_code_cut == "child")) %>%
pull(point_estimate)
0.388
prop_child_hyp <- 0.35
std_error <- 0.0096028
z_score <- (prop_child_samp - prop_child_hyp) / std_error
3.956
pnorm() adalah CDF normal.lower.tail = TRUE.lower.tail = FALSE.
p_value <- pnorm(z_score, lower.tail = FALSE)
3.818e-05
Pengujian Hipotesis di R