Asumsi dalam uji hipotesis

Pengujian Hipotesis dengan Python

James Chapman

Curriculum Manager, DataCamp

Keacakan

Asumsi

Sampel adalah subset acak dari populasi lebih besar

Konsekuensi
  • Sampel tidak mewakili populasi
Cara memeriksa
  • Pahami bagaimana data Anda dikumpulkan
  • Diskusikan dengan pengumpul data/ahli domain

Logo dengan frasa 'Responsibly Sourced Ingredients'.

1 Teknik pengambilan sampel dibahas di "Sampling in Python".
Pengujian Hipotesis dengan Python

Kemandirian observasi

Asumsi

Tiap observasi (baris) dalam dataset bersifat independen

Konsekuensi
  • Peningkatan peluang galat false negative/positive
Cara memeriksa
  • Pahami bagaimana data kami dikumpulkan
Pengujian Hipotesis dengan Python

Ukuran sampel besar

Asumsi

Sampel cukup besar untuk mengurangi ketidakpastian, sehingga Teorema Limit Pusat berlaku

Konsekuensi
  • Interval kepercayaan lebih lebar
  • Peningkatan peluang galat false negative/positive
Cara memeriksa
  • Bergantung pada uji
Pengujian Hipotesis dengan Python

Ukuran sampel besar: uji t

Satu sampel
  • Minimal 30 observasi dalam sampel

$n \ge 30$

$n$: ukuran sampel

Dua sampel
  • Minimal 30 observasi di tiap sampel

$n_{1} \ge 30, n_{2} \ge 30$

$n_{i}$: ukuran sampel untuk grup $i$

Sampel berpasangan
  • Minimal 30 pasangan observasi di seluruh sampel

Jumlah baris pada data kita $\ge 30$

ANOVA
  • Minimal 30 observasi di tiap sampel

$n_{i} \ge 30$ untuk semua $i$

Pengujian Hipotesis dengan Python

Ukuran sampel besar: uji proporsi

Satu sampel
  • Jumlah keberhasilan dalam sampel ≥ 10

$n \times \hat{p} \ge 10$

  • Jumlah kegagalan dalam sampel ≥ 10

$n \times (1 - \hat{p}) \ge 10$

$n$: ukuran sampel
$\hat{p}$: proporsi keberhasilan dalam sampel

Dua sampel
  • Jumlah keberhasilan di tiap sampel ≥ 10

$n_{1} \times \hat{p}_{1} \ge 10$

$n_{2} \times \hat{p}_{2} \ge 10$

  • Jumlah kegagalan di tiap sampel ≥ 10

$n_{1} \times (1 - \hat{p}_{1}) \ge 10$

$n_{2} \times (1 - \hat{p}_{2}) \ge 10$

Pengujian Hipotesis dengan Python

Ukuran sampel besar: uji khi-kuadrat

  • Jumlah keberhasilan di tiap grup ≥ 5

$n_{i} \times \hat{p}_{i} \ge 5$ untuk semua $i$

  • Jumlah kegagalan di tiap grup ≥ 5

$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ untuk semua $i$

$n_{i}$: ukuran sampel untuk grup $i$
$\hat{p}_{i}$: proporsi keberhasilan di grup sampel $i$

Pengujian Hipotesis dengan Python

Pemeriksaan cepat

Jika sebaran bootstrap tidak tampak normal, kemungkinan asumsi tidak terpenuhi

  • Tinjau ulang pengumpulan data untuk memeriksa keacakan, kemandirian, dan ukuran sampel
Pengujian Hipotesis dengan Python

Ayo berlatih!

Pengujian Hipotesis dengan Python

Preparing Video For Download...