Uji proporsi dua sampel

Pengujian Hipotesis di R

Richie Cotton

Data Evangelist at DataCamp

Membandingkan dua proporsi

$H_{0}$: Proporsi pengguna SO yang hobi sama antara yang <30 dan ≥30 tahun.

$H_{0}$: $p_{\geq30} - p_{<30} = 0$

$H_{A}$: Proporsi pengguna SO yang hobi berbeda antara yang <30 dan ≥30 tahun.

$H_{A}$: $p_{\geq30} - p_{<30} \neq 0$

alpha <- 0.05
Pengujian Hipotesis di R

Menghitung skor z

$$ z = \frac{(\hat{p}_{\geq30} - \hat{p}_{<30}) - 0}{\text{SE}(\hat{p}_{\geq30} - \hat{p}_{<30})} $$

$$ \text{SE}(\hat{p}_{\geq30} - \hat{p}_{<30}) = \sqrt{\dfrac{\hat{p} \times (1 - \hat{p})}{n_{\geq30}} + \dfrac{\hat{p} \times (1 - \hat{p})}{n_{<30}}} $$

$\hat{p}$ adalah estimasi gabungan untuk $p$ (proporsi keberhasilan umum yang tidak diketahui).

$$ \hat{p} = \frac{n_{\geq30} \times \hat{p}_{\geq30} + n_{<30} \times \hat{p}_{<30}}{n_{\geq30} + n_{<30} } $$

Kita hanya perlu menghitung 4 nilai: $\hat{p}_{\geq30}$, $\hat{p}_{<30}$, $n_{\geq30}$, $n_{<30}$.

Pengujian Hipotesis di R

Mengambil angka untuk skor z

stack_overflow %>%
  group_by(age_cat) %>%
  summarize(
    p_hat = mean(hobbyist == "Yes"),
    n = n()
  )
# A tibble: 2 x 3
  age_cat     p_hat     n
  <chr>       <dbl> <int>
1 At least 30 0.773  1050
2 Under 30    0.843  1216
z_score
-4.217
Pengujian Hipotesis di R

Uji proporsi dengan prop_test()

library(infer)
stack_overflow %>% 
  prop_test(

hobbyist ~ age_cat, # proportions ~ categories
order = c("At least 30", "Under 30"), # which p-hat to subtract
success = "Yes", # which response value to count proportions of
alternative = "two-sided", # type of alternative hypothesis
correct = FALSE # should Yates' continuity correction be applied?
)
# A tibble: 1 x 6
  statistic chisq_df   p_value alternative lower_ci upper_ci
      <dbl>    <dbl>     <dbl> <chr>          <dbl>    <dbl>
1      17.8        1 0.0000248 two.sided     0.0605    0.165
Pengujian Hipotesis di R

Ayo berlatih!

Pengujian Hipotesis di R

Preparing Video For Download...