Ki-kare uygunluk testi

R ile Hipotez Testi

Richie Cotton

Data Evangelist at DataCamp

Mor bağlantılar

Çevrimiçi bir kod çözümü arıyorsunuz ve ilk sonuç bağlantısı daha önce ziyaret ettiğiniz için mor. Nasıl hissediyorsunuz?

purple_link_counts <- stack_overflow %>% 
  count(purple_link)
# A tibble: 4 x 2
  purple_link           n
  <fct>             <int>
1 Hello, old friend  1330
2 Amused              409
3 Indifferent         426
4 Annoyed             290
R ile Hipotez Testi

Hipotezleri kurma

hypothesized <- tribble(
  ~ purple_link, ~ prop,
  "Hello, old friend", 1 / 2,
  "Amused"           , 1 / 6,
  "Indifferent"      , 1 / 6,
  "Annoyed"          , 1 / 6
)
# A tibble: 4 x 2
  purple_link        prop
  <chr>             <dbl>
1 Hello, old friend 0.5  
2 Amused            0.167
3 Indifferent       0.167
4 Annoyed           0.167

$H_{0}$: Örneklem varsayılan dağılımla uyumludur.

$H_{A}$: Örneklem varsayılan dağılımla uyumlu değildir.

Test istatistiği $\chi^{2}$, her grupta gözlenen sonuçların beklentilerden sapmasını ölçer.

alpha <- 0.01
1 tribble, "satır bazlı tibble"ın kısaltmasıdır; Star Trek’teki uzaylı türüyle karıştırılmamalıdır
R ile Hipotez Testi

Kategorilere göre varsayılan sayılar

n_total <- nrow(stack_overflow)
hypothesized <- tribble(
  ~ purple_link, ~ prop,
  "Hello, old friend", 1 / 2,
  "Amused"           , 1 / 6,
  "Indifferent"      , 1 / 6,
  "Annoyed"          , 1 / 6
) %>%
  mutate(n = prop * n_total)
# A tibble: 4 x 3
  purple_link        prop     n
  <chr>             <dbl> <dbl>
1 Hello, old friend 0.5   1228.
2 Amused            0.167  409.
3 Indifferent       0.167  409.
4 Annoyed           0.167  409.
R ile Hipotez Testi

Sayıları görselleştirme

ggplot(purple_link_counts, aes(purple_link, n)) +
  geom_col() +
  geom_point(data = hypothesized, color = "purple")

Mor noktalar varsayılan sayıları gösterirken, yanıta göre mor_link ve yanıt sayısı çubuk grafiği

R ile Hipotez Testi

chisq_test() ile ki-kare uygunluk testi

hypothesized_props <- c(
  "Hello, old friend" = 1 / 2,
  Amused              = 1 / 6,
  Indifferent         = 1 / 6,
  Annoyed             = 1 / 6
)
library(infer)
stack_overflow %>% 
  chisq_test(
    response = purple_link,
    p = hypothesized_props
  )
# A tibble: 1 x 3
  statistic chisq_df       p_value
      <dbl>    <dbl>         <dbl>
1      44.0        3 0.00000000154
R ile Hipotez Testi

Hadi pratik yapalım!

R ile Hipotez Testi

Preparing Video For Download...