Asumsi dalam uji hipotesis

Pengujian Hipotesis dengan Python

James Chapman

Curriculum Manager, DataCamp

Keacakan

Asumsi

Sampel adalah subset acak dari populasi lebih besar

Konsekuensi

Sampel tidak mewakili populasi

Cara memeriksa

Pahami bagaimana data Anda dikumpulkan
Diskusikan dengan pengumpul data/ahli domain

Logo dengan frasa 'Responsibly Sourced Ingredients'.

¹ Teknik pengambilan sampel dibahas di "Sampling in Python".

Kemandirian observasi

Asumsi

Tiap observasi (baris) dalam dataset bersifat independen

Konsekuensi

Peningkatan peluang galat false negative/positive

Cara memeriksa

Pahami bagaimana data kami dikumpulkan

Ukuran sampel besar

Asumsi

Sampel cukup besar untuk mengurangi ketidakpastian, sehingga Teorema Limit Pusat berlaku

Konsekuensi

Interval kepercayaan lebih lebar
Peningkatan peluang galat false negative/positive

Cara memeriksa

Bergantung pada uji

Ukuran sampel besar: uji t

Satu sampel

Minimal 30 observasi dalam sampel

$n \ge 30$

$n$: ukuran sampel

Dua sampel

Minimal 30 observasi di tiap sampel

$n_{1} \ge 30, n_{2} \ge 30$

$n_{i}$: ukuran sampel untuk grup $i$

Sampel berpasangan

Minimal 30 pasangan observasi di seluruh sampel

Jumlah baris pada data kita $\ge 30$

ANOVA

Minimal 30 observasi di tiap sampel

$n_{i} \ge 30$ untuk semua $i$

Ukuran sampel besar: uji proporsi

Satu sampel

Jumlah keberhasilan dalam sampel ≥ 10

$n \times \hat{p} \ge 10$

Jumlah kegagalan dalam sampel ≥ 10

$n \times (1 - \hat{p}) \ge 10$

$n$: ukuran sampel
$\hat{p}$: proporsi keberhasilan dalam sampel

Dua sampel

Jumlah keberhasilan di tiap sampel ≥ 10

$n_{1} \times \hat{p}_{1} \ge 10$

$n_{2} \times \hat{p}_{2} \ge 10$

Jumlah kegagalan di tiap sampel ≥ 10

$n_{1} \times (1 - \hat{p}_{1}) \ge 10$

$n_{2} \times (1 - \hat{p}_{2}) \ge 10$

Ukuran sampel besar: uji khi-kuadrat

Jumlah keberhasilan di tiap grup ≥ 5

$n_{i} \times \hat{p}_{i} \ge 5$ untuk semua $i$

Jumlah kegagalan di tiap grup ≥ 5

$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ untuk semua $i$

$n_{i}$: ukuran sampel untuk grup $i$
$\hat{p}_{i}$: proporsi keberhasilan di grup sampel $i$

Pemeriksaan cepat

Jika sebaran bootstrap tidak tampak normal, kemungkinan asumsi tidak terpenuhi

Tinjau ulang pengumpulan data untuk memeriksa keacakan, kemandirian, dan ukuran sampel

Ayo berlatih!

Pengujian Hipotesis dengan Python