ANOVA testleri

R ile Hipotez Testi

Richie Cotton

Data Evangelist at DataCamp

İş memnuniyeti: 5 kategori

stack_overflow %>% 
  count(job_sat)

# A tibble: 5 x 2
  job_sat                   n
  <fct>                 <int>
1 Very dissatisfied       187
2 Slightly dissatisfied   385
3 Neither                 245
4 Slightly satisfied      777
5 Very satisfied          981

Birden çok dağılımı görselleştirme

Soru: Ortalama yıllık ücret, iş memnuniyeti düzeylerine göre farklı mı?

stack_overflow %>% 
  ggplot(aes(x = job_sat, y = converted_comp)) +
  geom_boxplot() +
  coord_flip()

5 kategori için ücret dağılımını gösteren kutu grafiği. "Very satisfied" diğerlerinden biraz daha yüksek görünüyor, ancak söylemek zor.

Varyans analizi (ANOVA)

mdl_comp_vs_job_sat <- lm(converted_comp ~ job_sat, data = stack_overflow)

anova(mdl_comp_vs_job_sat)

Varyans Analizi Tablosu

Yanıt: converted_comp
            Df   Sum Sq  Mean Sq F value Pr(>F)   
job_sat      4 1.09e+12 2.73e+11    3.65 0.0057 **
Residuals 2570 1.92e+14 7.47e+10                  

Anlamlılık kodları:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

¹ lm() ile doğrusal regresyonlar "Introduction to Regression in R" dersinde öğretilmektedir

İkili testler

$\mu_{\text{very dissatisfied}} \neq \mu_{\text{slightly dissatisfied}}$
$\mu_{\text{very dissatisfied}} \neq \mu_{\text{neither}}$
$\mu_{\text{very dissatisfied}} \neq \mu_{\text{slightly satisfied}}$
$\mu_{\text{very dissatisfied}} \neq \mu_{\text{very satisfied}}$
$\mu_{\text{slightly dissatisfied}} \neq \mu_{\text{neither}}$

$\mu_{\text{slightly dissatisfied}} \neq \mu_{\text{slightly satisfied}}$
$\mu_{\text{slightly dissatisfied}} \neq \mu_{\text{very satisfied}}$
$\mu_{\text{neither}} \neq \mu_{\text{slightly satisfied}}$
$\mu_{\text{neither}} \neq \mu_{\text{very satisfied}}$
$\mu_{\text{slightly satisfied}} \neq \mu_{\text{very satisfied}}$

Anlamlılık düzeyini $\alpha = 0.2$ olarak ayarlayın.

pairwise.t.test()

pairwise.t.test(stack_overflow$converted_comp, stack_overflow$job_sat, p.adjust.method = "none")

    Pooled SD ile t testlerini kullanarak ikili karşılaştırmalar 

everi:  stack_overflow$converted_comp ve stack_overflow$job_sat 

                      Very dissatisfied Slightly dissatisfied Neither Slightly satisfied
Slightly dissatisfied 0.26860           -                     -       -                 
Neither               0.79578           0.36858               -       -                 
Slightly satisfied    0.29570           0.82931               0.41248 -                 
Very satisfied        0.34482           0.00384               0.15939 0.00084           

P değeri düzeltme yöntemi: none

Anlamlı farklar: "Very satisfied" vs. "Slightly dissatisfied"; "Very satisfied" vs. "Neither"; "Very satisfied" vs. "Slightly satisfied"

Grup sayısı arttıkça...

Çift sayısı ile grup sayısı arasındaki ilişkiyi gösteren saçılım grafiği. Grup sayısı arttıkça çift sayısı kadratik olarak artar.

En az 1 anlamlı sonucun elde edilme olasılığı ile grup sayısı arasındaki ilişkiyi gösteren saçılım grafiği. Grup sayısı arttıkça en az 1 anlamlı sonuç olasılığı artar.

Bonferroni düzeltmesi

pairwise.t.test(stack_overflow$converted_comp, stack_overflow$job_sat, p.adjust.method = "bonferroni")

    Pooled SD ile t testlerini kullanarak ikili karşılaştırmalar 

everi:  stack_overflow$converted_comp ve stack_overflow$job_sat 

                      Very dissatisfied Slightly dissatisfied Neither Slightly satisfied
Slightly dissatisfied 1.0000            -                     -       -                 
Neither               1.0000            1.0000                -       -                 
Slightly satisfied    1.0000            1.0000                1.0000  -                 
Very satisfied        1.0000            0.0384                1.0000  0.0084            

P değeri düzeltme yöntemi: bonferroni

Anlamlı farklar: "Very satisfied" vs. "Slightly dissatisfied"; "Very satisfied" vs. "Slightly satisfied"

Diğer yöntemler

p.adjust.methods

"holm"  "hochberg"  "hommel"  "bonferroni"  "BH"  "BY"  "fdr"  "none"

Bonferroni ve Holm düzeltmeleri

p_values

0.268603 0.795778 0.295702 0.344819 0.368580 0.829315 0.003840 0.412482 0.159389 0.000838

Bonferroni

pmin(1, 10 * p_values)

1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 0.03840 1.00000 1.00000 0.00838

Holm (yaklaşık)

pmin(1, 10:1 * sort(p_values))

0.00838 0.03456 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 0.82931

Haydi pratik yapalım!

R ile Hipotez Testi