Hipotez testindeki varsayımlar

R ile Hipotez Testi

Richie Cotton

Data Evangelist at DataCamp

Rastgelelik

Varsayım

Örneklemler, daha büyük ana kitlelerin rastgele alt kümeleridir.

Sonuç
  • Örneklem ana kitleyi temsil etmeyebilir.
Nasıl kontrol edilir
  • Verinizin nasıl toplandığını anlayın.
  • Veri toplayan/alan uzmanıyla görüşün.

'Sorumlu Kaynaklı İçerikler' ifadesi olan bir logo.

1 Örnekleme teknikleri "Sampling in R" içinde ele alınmıştır.
R ile Hipotez Testi

Gözlemlerin bağımsızlığı

Varsayım

Veri setindeki her gözlem (satır) bağımsızdır.

Sonuç
  • Yanlış negatif/pozitif hata olasılığı artar.
Nasıl kontrol edilir
  • Verinizin nasıl toplandığını anlayın.
R ile Hipotez Testi

Büyük örneklem

Varsayım

Örneklem, belirsizliği azaltacak ve Merkezi Limit Teoremi'nin geçerli olacağı kadar büyüktür.

Sonuç
  • Çok geniş güven aralıkları.
  • Yanlış negatif/pozitif hata olasılığı artar.
Nasıl kontrol edilir
  • Teste bağlıdır.
R ile Hipotez Testi

Büyük örneklem: t-testi

Tek örneklem
  • Örneklemde en az 30$^{1}$ gözlem.

$n \ge 30$

$n$: örneklem büyüklüğü

İki örneklem
  • Her örneklemde en az 30 gözlem.

$n_{1} \ge 30, n_{2} \ge 30$

$n_{i}$: grup $i$ için örneklem büyüklüğü

Eşleştirilmiş örneklemler
  • Örneklemler arasında en az 30 gözlem çifti.

Verinizdeki satır sayısı $\ge 30$

ANOVA
  • Her örneklemde en az 30 gözlem.

$n_{i} \ge 30$ tüm $i$ için

1 Bazen 30'dan azı da yeter; önemli olan sıfır dağılımının normal görünmesidir.
R ile Hipotez Testi

Büyük örneklem: oran testleri

Tek örneklem
  • Örneklemdeki başarı sayısı en az 10.

$n \times \hat{p} \ge 10$

  • Örneklemdeki başarısızlık sayısı en az 10.

$n \times (1 - \hat{p}) \ge 10$

$n$: örneklem büyüklüğü
$\hat{p}$: örneklemdeki başarı oranı

İki örneklem
  • Her örneklemde başarı sayısı en az 10.

$n_{1} \times \hat{p}_{1} \ge 10$

$n_{2} \times \hat{p}_{2} \ge 10$

  • Her örneklemde başarısızlık sayısı en az 10.

$n_{1} \times (1 - \hat{p}_{1}) \ge 10$

$n_{2} \times (1 - \hat{p}_{2}) \ge 10$

R ile Hipotez Testi

Büyük örneklem: ki-kare testleri

  • Her gruptaki başarı sayısı en az 5.

$n_{i} \times \hat{p}_{i} \ge 5$ tüm $i$ için

  • Her gruptaki başarısızlık sayısı en az 5.

$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ tüm $i$ için

$n_{i}$: grup $i$ için örneklem büyüklüğü
$\hat{p}_{i}$: grup $i$ için örneklemdeki başarı oranı

R ile Hipotez Testi

Sağlama

Bootstrap dağılımı normal görünmüyorsa, varsayımlar muhtemelen geçerli değildir.

R ile Hipotez Testi

Haydi pratik yapalım!

R ile Hipotez Testi

Preparing Video For Download...