Asumsi dalam uji hipotesis

Pengujian Hipotesis di R

Richie Cotton

Data Evangelist at DataCamp

Keacakan

Asumsi

Sampel adalah subset acak dari populasi lebih besar.

Konsekuensi
  • Sampel tidak mewakili populasi.
Cara memeriksa
  • Pahami cara data dikumpulkan.
  • Diskusikan dengan pengumpul data/ahli domain.

Logo dengan frasa 'Responsibly Sourced Ingredients'.

1 Teknik sampling dibahas di "Sampling in R".
Pengujian Hipotesis di R

Independensi observasi

Asumsi

Setiap observasi (baris) di dataset bersifat independen.

Konsekuensi
  • Peningkatan peluang galat negatif/positif palsu.
Cara memeriksa
  • Pahami cara data dikumpulkan.
Pengujian Hipotesis di R

Ukuran sampel besar

Asumsi

Sampel cukup besar untuk mengurangi ketidakpastian, sehingga Teorema Limit Pusat berlaku.

Konsekuensi
  • Interval kepercayaan sangat lebar.
  • Peningkatan peluang galat negatif/positif palsu.
Cara memeriksa
  • Tergantung uji yang digunakan.
Pengujian Hipotesis di R

Ukuran sampel besar: uji t

Satu sampel
  • Minimal 30$^{1}$ observasi dalam sampel.

$n \ge 30$

$n$: ukuran sampel

Dua sampel
  • Minimal 30 observasi di tiap sampel.

$n_{1} \ge 30, n_{2} \ge 30$

$n_{i}$: ukuran sampel untuk grup $i$

Berpasangan
  • Minimal 30 pasangan observasi di kedua sampel.

Jumlah baris data Anda $\ge 30$

ANOVA
  • Minimal 30 observasi di tiap sampel.

$n_{i} \ge 30$ untuk semua $i$

1 Terkadang kurang dari 30 masih bisa; yang penting distribusi nol tampak normal.
Pengujian Hipotesis di R

Sampel besar: uji proporsi

Satu sampel
  • Jumlah keberhasilan di sampel ≥ 10.

$n \times \hat{p} \ge 10$

  • Jumlah kegagalan di sampel ≥ 10.

$n \times (1 - \hat{p}) \ge 10$

$n$: ukuran sampel
$\hat{p}$: proporsi keberhasilan di sampel

Dua sampel
  • Jumlah keberhasilan di tiap sampel ≥ 10.

$n_{1} \times \hat{p}_{1} \ge 10$

$n_{2} \times \hat{p}_{2} \ge 10$

  • Jumlah kegagalan di tiap sampel ≥ 10.

$n_{1} \times (1 - \hat{p}_{1}) \ge 10$

$n_{2} \times (1 - \hat{p}_{2}) \ge 10$

Pengujian Hipotesis di R

Sampel besar: uji chi-square

  • Jumlah keberhasilan di tiap grup ≥ 5.

$n_{i} \times \hat{p}_{i} \ge 5$ untuk semua $i$

  • Jumlah kegagalan di tiap grup ≥ 5.

$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ untuk semua $i$

$n_{i}$: ukuran sampel grup $i$
$\hat{p}_{i}$: proporsi keberhasilan di grup $i$

Pengujian Hipotesis di R

Pemeriksaan cepat

Jika distribusi bootstrap tidak tampak normal, kemungkinan asumsi tidak terpenuhi.

Pengujian Hipotesis di R

Ayo berlatih!

Pengujian Hipotesis di R

Preparing Video For Download...