Asumsi dalam uji hipotesis

Pengujian Hipotesis di R

Richie Cotton

Data Evangelist at DataCamp

Keacakan

Asumsi

Sampel adalah subset acak dari populasi lebih besar.

Konsekuensi

Sampel tidak mewakili populasi.

Cara memeriksa

Pahami cara data dikumpulkan.
Diskusikan dengan pengumpul data/ahli domain.

Logo dengan frasa 'Responsibly Sourced Ingredients'.

¹ Teknik sampling dibahas di "Sampling in R".

Independensi observasi

Asumsi

Setiap observasi (baris) di dataset bersifat independen.

Konsekuensi

Peningkatan peluang galat negatif/positif palsu.

Cara memeriksa

Pahami cara data dikumpulkan.

Ukuran sampel besar

Asumsi

Sampel cukup besar untuk mengurangi ketidakpastian, sehingga Teorema Limit Pusat berlaku.

Konsekuensi

Interval kepercayaan sangat lebar.
Peningkatan peluang galat negatif/positif palsu.

Cara memeriksa

Tergantung uji yang digunakan.

Ukuran sampel besar: uji t

Satu sampel

Minimal 30$^{1}$ observasi dalam sampel.

$n \ge 30$

$n$: ukuran sampel

Dua sampel

Minimal 30 observasi di tiap sampel.

$n_{1} \ge 30, n_{2} \ge 30$

$n_{i}$: ukuran sampel untuk grup $i$

Berpasangan

Minimal 30 pasangan observasi di kedua sampel.

Jumlah baris data Anda $\ge 30$

ANOVA

Minimal 30 observasi di tiap sampel.

$n_{i} \ge 30$ untuk semua $i$

¹ Terkadang kurang dari 30 masih bisa; yang penting distribusi nol tampak normal.

Sampel besar: uji proporsi

Satu sampel

Jumlah keberhasilan di sampel ≥ 10.

$n \times \hat{p} \ge 10$

Jumlah kegagalan di sampel ≥ 10.

$n \times (1 - \hat{p}) \ge 10$

$n$: ukuran sampel
$\hat{p}$: proporsi keberhasilan di sampel

Dua sampel

Jumlah keberhasilan di tiap sampel ≥ 10.

$n_{1} \times \hat{p}_{1} \ge 10$

$n_{2} \times \hat{p}_{2} \ge 10$

Jumlah kegagalan di tiap sampel ≥ 10.

$n_{1} \times (1 - \hat{p}_{1}) \ge 10$

$n_{2} \times (1 - \hat{p}_{2}) \ge 10$

Sampel besar: uji chi-square

Jumlah keberhasilan di tiap grup ≥ 5.

$n_{i} \times \hat{p}_{i} \ge 5$ untuk semua $i$

Jumlah kegagalan di tiap grup ≥ 5.

$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ untuk semua $i$

$n_{i}$: ukuran sampel grup $i$
$\hat{p}_{i}$: proporsi keberhasilan di grup $i$

Pemeriksaan cepat

Jika distribusi bootstrap tidak tampak normal, kemungkinan asumsi tidak terpenuhi.

Ayo berlatih!

Pengujian Hipotesis di R