Intervalli per differenze

Inferenza per dati categorici in R

Andrew Bray

Assistant Professor of Statistics at Reed College

Una domanda a due variabili

Donne e uomini credono in proporzioni diverse?

Sia $p$ la quota che crede nella vita dopo la morte.

  • $H_{0} : p_{female} - p_{male} = 0$
  • $H_{A} : p_{female} - p_{male} \ne 0$
Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

ggplot(gss2016, aes(x = sex, fill = postlife)) +
  geom_bar()

ch2v2-postlife-barplot.png

Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

ggplot(gss2016, aes(x = sex, fill = postlife)) +
  geom_bar(position = "fill")

ch2v2-postlife-barplot-filled.png

Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

p_hats <- gss2016 %>%
  group_by(sex) %>%
  summarize(mean(postlife == "YES", na.rm = TRUE)) %>%
  pull()
d_hat <- diff(p_hats)
d_hat
0.1472851
Inferenza per dati categorici in R

Generare dati da H0

  • $H_{0} : p_{female} - p_{male} = 0$
  • Nessuna associazione tra credenza nell’aldilà e sesso del soggetto.
  • La variabile postlife è indipendente da sex.

Genera dati per permutazione

Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

gss2016 %>%
  specify(
    response = postlife, 
    explanatory = sex, 
    success = "YES"
  ) %>%
  hypothesize(null = "independence") %>%
  generate(reps = 1, type = "permute")
Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

gss2016 %>%
  specify(
    postlife ~ sex,  # this line is new
    success = "YES"
  ) %>%
  hypothesize(null = "independence") %>%
  generate(reps = 1, type = "permute")
Response: postlife (factor)
Explanatory: sex (factor)
Null Hypothesis:  independence 
# A tibble: 137 x 3
# Groups:   replicate [1]
   postlife sex    replicate
   <fct>    <fct>      <int>
 1 YES      FEMALE         1
 2 YES      MALE           1
 3 YES      FEMALE         1
 4 YES      MALE           1
 5 YES      MALE           1
 6 YES      FEMALE         1
 7 NO       FEMALE         1
Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

gss2016 %>%
  specify(
    postlife ~ sex, 
    success = "YES"
  ) %>%
  hypothesize(null = "independence") %>%
  generate(reps = 1, type = "permute")
Response: postlife (factor)
Explanatory: sex (factor)
Null Hypothesis:  independence 
# A tibble: 137 x 3
# Groups:   replicate [1]
   postlife sex    replicate
   <fct>    <fct>      <int>
 1 YES      FEMALE         1
 2 NO       MALE           1
 3 NO       FEMALE         1
 4 YES      MALE           1
 5 YES      MALE           1
 6 YES      FEMALE         1
 7 YES      FEMALE         1
Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

gss2016 %>%
  specify(postlife ~ sex, success = "YES") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 500, type = "permute") %>%
  calculate(stat = "diff in props", order = c("FEMALE", "MALE"))
Warning message:
Removed 13 rows containing missing values.
Inferenza per dati categorici in R

Donne e uomini hanno opinioni diverse sulla vita dopo la morte?

ggplot(null, aes(x = stat)) +
  geom_density() +
  geom_vline(xintercept = d_hat, color = "red")

Questi dati suggeriscono una differenza tra i sessi nella credenza nella vita dopo la morte.

ch2v2-density-plot.png

Inferenza per dati categorici in R

Ayo berlatih!

Inferenza per dati categorici in R

Preparing Video For Download...