R ile Hipotez Testi
Richie Cotton
Data Evangelist at DataCamp
stack_overflow_imbalanced %>%
count(hobbyist, age_cat, .drop = FALSE)
hobbyist age_cat n
1 No At least 30 0
2 No Under 30 191
3 Yes At least 30 15
4 Yes Under 30 1025
Bazı gruplar diğerlerinden çok daha büyükse örneklem dengesizdir.
$H_{0}$: 30 yaş altı hobicilerin oranı, en az 30 yaş hobicilerin oranıyla aynıdır.
$H_{A}$: 30 yaş altı hobicilerin oranı, en az 30 yaş hobicilerin oranından farklıdır.
alpha <- 0.1
stack_overflow_imbalanced %>%
prop_test(
hobbyist ~ age_cat,
order = c("At least 30", "Under 30"),
success = "Yes",
alternative = "two.sided",
correct = FALSE
)
# A tibble: 1 x 6
statistic chisq_df p_value alternative lower_ci upper_ci
<dbl> <dbl> <dbl> <chr> <dbl> <dbl>
1 2.79 1 0.0949 two.sided 0.00718 0.0217
| Grafik türü | base-R | ggplot2 |
|---|---|---|
| Saçılım grafiği | plot(, type = "p") |
ggplot() + geom_point() |
| Çizgi grafiği | plot(, type = "l") |
ggplot() + geom_line() |
| Histogram | hist() |
ggplot() + geom_histogram() |
| Kutu grafiği | boxplot() |
ggplot() + geom_boxplot() |
| Çubuk grafiği | barplot() |
ggplot() + geom_bar() |
| Pasta grafiği | pie() |
ggplot() + geom_bar() + coord_polar() |
infer paketinde uygulanmıştır.generate() benzetim verisi üretir.null_distn <- dataset %>%
specify() %>%
hypothesize() %>%
generate() %>%
calculate()
obs_stat <- dataset %>%
specify() %>%
calculate()
get_p_value(null_distn, obs_stat)

specify()test etmek istediğiniz değişken(ler)i seçer.
response ~ explanatory kullanın.response ~ NULL kullanın.stack_overflow_imbalanced %>%
specify(hobbyist ~ age_cat, success = "Yes")
Response: hobbyist (factor)
Explanatory: age_cat (factor)
# A tibble: 1,231 x 2
hobbyist age_cat
<fct> <fct>
1 Yes At least 30
2 Yes At least 30
3 Yes At least 30
4 Yes Under 30
5 Yes At least 30
6 Yes At least 30
7 No Under 30
# ... with 1,224 more rows
hypothesize()sıfır hipotezi türünü belirtir.
"independence" veya "point" kullanın."point" kullanın.stack_overflow_imbalanced %>%
specify(hobbyist ~ age_cat, success = "Yes") %>%
hypothesize(null = "independence")
Response: hobbyist (factor)
Explanatory: age_cat (factor)
Null Hypothesis: independence
# A tibble: 1,231 x 2
hobbyist age_cat
<fct> <fct>
1 Yes At least 30
2 Yes At least 30
3 Yes At least 30
4 Yes Under 30
5 Yes At least 30
6 Yes At least 30
7 No Under 30
# ... with 1,224 more rows
R ile Hipotez Testi