Uji non-parametrik

Dasar-dasar Inferensi di Python

Paul Savala

Assistant Professor of Mathematics

Uji non-parametrik

  • Mungkin punya asumsi
  • Tidak butuh kenormalan
  • Berlaku untuk banyak jenis data
  • Terkadang kurang kuat
  • Berguna untuk data berperingkat (mis. rating bintang)

Empat histogram, masing-masing dengan bentuk data berbeda.

Dasar-dasar Inferensi di Python

Uji parametrik

 

  • Uji t sampel independen
  • ANOVA
  • Uji t berpasangan
  • R Pearson

Non-parametrik

 

  • Uji Wilcoxon-Mann-Whitney U
  • Uji Kruskal–Wallis
  • Uji median Mood
  • Tau Kendall
Dasar-dasar Inferensi di Python

Uji median Mood

Membandingkan median dari dua pengukuran berpasangan

Lima baris DataFrame dengan berbagai universitas, dan dua kolom nilai universitas.

Kemungkinan tidak berdistribusi normal

s, p_value, m, table = stats.median_test(df['thew_score'], df['arw_score'])
Dasar-dasar Inferensi di Python

Uji median Mood

print(p_value < 0.05)
TRUE
  • Kesimpulan: Median peringkat berbeda
  • Uji t mengasumsikan normalitas (uji median Mood tidak)
  • Inferensi valid hanya jika data dan asumsi cocok
  • Gunakan alat yang tepat untuk tugasnya!
Dasar-dasar Inferensi di Python

Tau Kendall

  • Nilai antara -1 dan 1
  • $\tau = -1$: Ketidakselarasan penuh
  • $\tau = 0$: Tidak berkorelasi
  • $\tau = 1$: Keselarasan penuh

Lima baris DataFrame dengan berbagai universitas, menampilkan peringkat untuk tiap universitas.

tau, p_value = stats.kendalltau(
    df['thew_rank'], 
    df['arw_rank'])

print(tau, p_value < 0.05)
0.651, TRUE
Dasar-dasar Inferensi di Python

Ayo berlatih!

Dasar-dasar Inferensi di Python

Preparing Video For Download...