Uji chi-square goodness of fit

Pengujian Hipotesis di R

Richie Cotton

Data Evangelist at DataCamp

Tautan ungu

Anda mencari solusi pemrograman online dan tautan hasil pertama berwarna ungu karena sudah pernah dikunjungi. Apa yang Anda rasakan?

purple_link_counts <- stack_overflow %>% 
  count(purple_link)
# A tibble: 4 x 2
  purple_link           n
  <fct>             <int>
1 Hello, old friend  1330
2 Amused              409
3 Indifferent         426
4 Annoyed             290
Pengujian Hipotesis di R

Merumuskan hipotesis

hypothesized <- tribble(
  ~ purple_link, ~ prop,
  "Hello, old friend", 1 / 2,
  "Amused"           , 1 / 6,
  "Indifferent"      , 1 / 6,
  "Annoyed"          , 1 / 6
)
# A tibble: 4 x 2
  purple_link        prop
  <chr>             <dbl>
1 Hello, old friend 0.5  
2 Amused            0.167
3 Indifferent       0.167
4 Annoyed           0.167

$H_{0}$: Sampel sesuai dengan distribusi yang dihipotesiskan.

$H_{A}$: Sampel tidak sesuai dengan distribusi yang dihipotesiskan.

Statistik uji, $\chi^{2}$, mengukur seberapa jauh hasil teramati dari ekspektasi di tiap grup.

alpha <- 0.01
1 tribble adalah singkatan dari "row-wise tibble"; jangan bingung dengan spesies alien dari Star Trek
Pengujian Hipotesis di R

Hitungan yang dihipotesiskan per kategori

n_total <- nrow(stack_overflow)
hypothesized <- tribble(
  ~ purple_link, ~ prop,
  "Hello, old friend", 1 / 2,
  "Amused"           , 1 / 6,
  "Indifferent"      , 1 / 6,
  "Annoyed"          , 1 / 6
) %>%
  mutate(n = prop * n_total)
# A tibble: 4 x 3
  purple_link        prop     n
  <chr>             <dbl> <dbl>
1 Hello, old friend 0.5   1228.
2 Amused            0.167  409.
3 Indifferent       0.167  409.
4 Annoyed           0.167  409.
Pengujian Hipotesis di R

Memvisualisasikan hitungan

ggplot(purple_link_counts, aes(purple_link, n)) +
  geom_col() +
  geom_point(data = hypothesized, color = "purple")

Plot batang jumlah jawaban vs jawaban purple_link dengan titik ungu mewakili jumlah yang dihipotesiskan

Pengujian Hipotesis di R

Uji chi-square goodness of fit dengan chisq_test()

hypothesized_props <- c(
  "Hello, old friend" = 1 / 2,
  Amused              = 1 / 6,
  Indifferent         = 1 / 6,
  Annoyed             = 1 / 6
)
library(infer)
stack_overflow %>% 
  chisq_test(
    response = purple_link,
    p = hypothesized_props
  )
# A tibble: 1 x 3
  statistic chisq_df       p_value
      <dbl>    <dbl>         <dbl>
1      44.0        3 0.00000000154
Pengujian Hipotesis di R

Ayo berlatih!

Pengujian Hipotesis di R

Preparing Video For Download...