Hypothesis Testing in R
Richie Cotton
Data Evangelist at DataCamp
Het significantieniveau van een hypothesetoets ($\alpha$) is de drempel voor "buiten redelijke twijfel".
0.1, 0.05 en 0.01.alpha <- 0.05
prop_child_samp <- stack_overflow %>%
summarize(
point_estimate = mean(age_first_code_cut == "child")
) %>%
pull(point_estimate)
prop_child_hyp <- 0.35
std_error <- 0.0096028
z_score <- (prop_child_samp - prop_child_hyp) / std_error
p_value <- pnorm(z_score, lower.tail = FALSE)
3.818e-05
p_value <= alpha
TRUE
p_value is kleiner dan of gelijk aan alpha, dus verwerp $H_{0}$ en accepteer $H_{A}$.
Het aandeel data scientists dat als kind begon met programmeren is groter dan 35%.
Voor een significantieniveau van 0,05 kies je vaak een betrouwbaarheidsinterval van 1 - 0.05 = 0.95.
conf_int <- first_code_boot_distn %>%
summarize(
lower = quantile(first_code_child_rate, 0.025),
upper = quantile(first_code_child_rate, 0.975)
)
# A tibble: 1 x 2
lower upper
<dbl> <dbl>
1 0.369 0.407
| Werkte misdaad niet echt | Pleegde misdaad echt | |
|---|---|---|
| Vonnis onschuldig | correct | ze kwamen ermee weg |
| Vonnis schuldig | onterechte veroordeling | correct |
| werkelijke $H_{0}$ | werkelijke $H_{A}$ | |
|---|---|---|
| gekozen $H_{0}$ | correct | vals-negatief |
| gekozen $H_{A}$ | vals-positief | correct |
Vals-positieven zijn Type I-fouten; vals-negatieven zijn Type II-fouten.
Als $p \le \alpha$, verwerpen we $H_{0}$:
Als $ p \gt \alpha$, verwerpen we $H_{0}$ niet:
Hypothesis Testing in R