Uji hipotesis untuk proporsi

Inferensi untuk Data Kategorik di R

Andrew Bray

Assistant Professor of Statistics at Reed College

2-1-1.png

Inferensi untuk Data Kategorik di R

2-1-2.png

Inferensi untuk Data Kategorik di R

2-1-3.png

Inferensi untuk Data Kategorik di R

2-1-4.png

Inferensi untuk Data Kategorik di R

2-1-5.png

Inferensi untuk Data Kategorik di R

2-1-6.png

Inferensi untuk Data Kategorik di R

Apakah setengah orang Amerika mendukung hukuman mati?

gss2016 %>%
  ggplot(aes(x = cappun)) +
  geom_bar()
p_hat <- gss2016 %>%
  summarize(mean(cappun == "FAVOR")) %>%
  pull()
p_hat
0.5666667

Plot kepadatan ch2v1

Inferensi untuk Data Kategorik di R

Apakah setengah orang Amerika mendukung hukuman mati?

null <- gss2016 %>%
  specify(
    response = cappun, 
    success = "FAVOR"
  ) %>%
  hypothesize(
    null = "point", 
    p = 0.5
  ) %>%
  generate(
    reps = 500, 
    type = "simulate"
  ) %>%
  calculate(stat = "prop")
A tibble: 500 x 2
   replicate  stat
   <fct>     <dbl>
 1 1         0.48 
 2 2         0.447
 3 3         0.48 
 4 4         0.44 
 5 5         0.407
 6 6         0.52 
 7 7         0.413
 8 8         0.553
 9 9         0.52 
10 10        0.467
# … with 490 more rows
Inferensi untuk Data Kategorik di R

Apakah setengah orang Amerika mendukung hukuman mati?

ggplot(null, aes(x = stat)) +
  geom_density() +
  geom_vline(
    xintercept = p_hat, 
    color = "red"
  )
null %>%
  summarize(mean(stat > p_hat)) %>%
  pull() * 2

Plot kepadatan ch2v1

Inferensi untuk Data Kategorik di R

Uji hipotesis

  • Hipotesis nol: teori tentang keadaan dunia.
  • Distribusi nol: sebaran statistik uji saat hipotesis nol benar.
  • p-value: ukuran kesesuaian antara hipotesis nol dan data Anda.
    • p-value tinggi: konsisten (p-val > alpha)
    • p-value rendah: tidak konsisten (p-val < alpha)
Inferensi untuk Data Kategorik di R

Ayo berlatih!

Inferensi untuk Data Kategorik di R

Preparing Video For Download...