Test d’ipotesi per una proporzione

Inferenza per dati categorici in R

Andrew Bray

Assistant Professor of Statistics at Reed College

2-1-1.png

Inferenza per dati categorici in R

2-1-2.png

Inferenza per dati categorici in R

2-1-3.png

Inferenza per dati categorici in R

2-1-4.png

Inferenza per dati categorici in R

2-1-5.png

Inferenza per dati categorici in R

2-1-6.png

Inferenza per dati categorici in R

La metà degli americani è favorevole alla pena di morte?

gss2016 %>%
  ggplot(aes(x = cappun)) +
  geom_bar()
p_hat <- gss2016 %>%
  summarize(mean(cappun == "FAVOR")) %>%
  pull()
p_hat
0.5666667

Grafico di densità ch2v1

Inferenza per dati categorici in R

La metà degli americani è favorevole alla pena di morte?

null <- gss2016 %>%
  specify(
    response = cappun, 
    success = "FAVOR"
  ) %>%
  hypothesize(
    null = "point", 
    p = 0.5
  ) %>%
  generate(
    reps = 500, 
    type = "simulate"
  ) %>%
  calculate(stat = "prop")
A tibble: 500 x 2
   replicate  stat
   <fct>     <dbl>
 1 1         0.48 
 2 2         0.447
 3 3         0.48 
 4 4         0.44 
 5 5         0.407
 6 6         0.52 
 7 7         0.413
 8 8         0.553
 9 9         0.52 
10 10        0.467
# … with 490 more rows
Inferenza per dati categorici in R

La metà degli americani è favorevole alla pena di morte?

ggplot(null, aes(x = stat)) +
  geom_density() +
  geom_vline(
    xintercept = p_hat, 
    color = "red"
  )
null %>%
  summarize(mean(stat > p_hat)) %>%
  pull() * 2

Grafico di densità ch2v1

Inferenza per dati categorici in R

Test d’ipotesi

  • Ipotesi nulla: teoria sullo stato del mondo.
  • Distribuzione nulla: distribuzione della statistica del test assumendo vera la nulla.
  • p-value: misura della coerenza tra ipotesi nulla e osservazioni.
    • p-value alto: coerente (p-val > alpha)
    • p-value basso: incoerente (p-val < alpha)
Inferenza per dati categorici in R

Passons à la pratique !

Inferenza per dati categorici in R

Preparing Video For Download...