Hipotez testindeki varsayımlar

R ile Hipotez Testi

Richie Cotton

Data Evangelist at DataCamp

Rastgelelik

Varsayım

Örneklemler, daha büyük ana kitlelerin rastgele alt kümeleridir.

Sonuç

Örneklem ana kitleyi temsil etmeyebilir.

Nasıl kontrol edilir

Verinizin nasıl toplandığını anlayın.
Veri toplayan/alan uzmanıyla görüşün.

'Sorumlu Kaynaklı İçerikler' ifadesi olan bir logo.

¹ Örnekleme teknikleri "Sampling in R" içinde ele alınmıştır.

Gözlemlerin bağımsızlığı

Varsayım

Veri setindeki her gözlem (satır) bağımsızdır.

Sonuç

Yanlış negatif/pozitif hata olasılığı artar.

Nasıl kontrol edilir

Verinizin nasıl toplandığını anlayın.

Büyük örneklem

Varsayım

Örneklem, belirsizliği azaltacak ve Merkezi Limit Teoremi'nin geçerli olacağı kadar büyüktür.

Sonuç

Çok geniş güven aralıkları.
Yanlış negatif/pozitif hata olasılığı artar.

Nasıl kontrol edilir

Teste bağlıdır.

Büyük örneklem: t-testi

Tek örneklem

Örneklemde en az 30$^{1}$ gözlem.

$n \ge 30$

$n$: örneklem büyüklüğü

İki örneklem

Her örneklemde en az 30 gözlem.

$n_{1} \ge 30, n_{2} \ge 30$

$n_{i}$: grup $i$ için örneklem büyüklüğü

Eşleştirilmiş örneklemler

Örneklemler arasında en az 30 gözlem çifti.

Verinizdeki satır sayısı $\ge 30$

ANOVA

Her örneklemde en az 30 gözlem.

$n_{i} \ge 30$ tüm $i$ için

¹ Bazen 30'dan azı da yeter; önemli olan sıfır dağılımının normal görünmesidir.

Büyük örneklem: oran testleri

Tek örneklem

Örneklemdeki başarı sayısı en az 10.

$n \times \hat{p} \ge 10$

Örneklemdeki başarısızlık sayısı en az 10.

$n \times (1 - \hat{p}) \ge 10$

$n$: örneklem büyüklüğü
$\hat{p}$: örneklemdeki başarı oranı

İki örneklem

Her örneklemde başarı sayısı en az 10.

$n_{1} \times \hat{p}_{1} \ge 10$

$n_{2} \times \hat{p}_{2} \ge 10$

Her örneklemde başarısızlık sayısı en az 10.

$n_{1} \times (1 - \hat{p}_{1}) \ge 10$

$n_{2} \times (1 - \hat{p}_{2}) \ge 10$

Büyük örneklem: ki-kare testleri

Her gruptaki başarı sayısı en az 5.

$n_{i} \times \hat{p}_{i} \ge 5$ tüm $i$ için

Her gruptaki başarısızlık sayısı en az 5.

$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ tüm $i$ için

$n_{i}$: grup $i$ için örneklem büyüklüğü
$\hat{p}_{i}$: grup $i$ için örneklemdeki başarı oranı

Sağlama

Bootstrap dağılımı normal görünmüyorsa, varsayımlar muhtemelen geçerli değildir.

Haydi pratik yapalım!

R ile Hipotez Testi