Signifikansi statistik

Pengujian Hipotesis dengan Python

James Chapman

Curriculum Manager, DataCamp

Ulangan p-value

  • p-value mengukur bukti untuk hipotesis nol
  • p-value besar → gagal menolak hipotesis nol
  • p-value kecil → tolak hipotesis nol
  • Titik batasnya di mana?
Pengujian Hipotesis dengan Python

Tingkat signifikansi

Tingkat signifikansi uji hipotesis ($\alpha$) adalah ambang untuk "melampaui keraguan wajar"

  • Nilai $\alpha$ umum: 0.2, 0.1, 0.05, dan 0.01
  • Jika $p \le \alpha$, tolak $H_{0}$; jika tidak, gagal menolak $H_{0}$
  • $\alpha$ harus ditetapkan sebelum menjalankan uji hipotesis
Pengujian Hipotesis dengan Python

Menghitung p-value

alpha = 0.05

prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean() prop_child_hyp = 0.35
std_error = np.std(first_code_boot_distn, ddof=1)
z_score = (prop_child_samp - prop_child_hyp) / std_error
p_value = 1 - norm.cdf(z_score, loc=0, scale=1)
3.1471479512323874e-05
Pengujian Hipotesis dengan Python

Membuat keputusan

alpha = 0.05

print(p_value)
3.1471479512323874e-05
p_value <= alpha
True

Tolak $H_{0}$ demi $H_{A}$

Pengujian Hipotesis dengan Python

Interval kepercayaan

Untuk tingkat signifikansi $\alpha$, umum memilih tingkat interval kepercayaan 1 - $\alpha$

  • $\alpha=0.05$ → interval kepercayaan $95\%$
import numpy as np
lower = np.quantile(first_code_boot_distn, 0.025)
upper = np.quantile(first_code_boot_distn, 0.975)
print((lower, upper))
(0.37063246351172047, 0.41132242370632466)
Pengujian Hipotesis dengan Python

Jenis galat

Benar-benar tidak melakukan kejahatan Benar-benar melakukan kejahatan
Vonis tidak bersalah benar lolos tanpa hukuman
Vonis bersalah salah vonis benar

 

$H_{0}$ sebenarnya $H_{A}$ sebenarnya
memilih $H_{0}$ benar false negative
memilih $H_{A}$ false positive benar

 

False positive adalah galat Tipe I; false negative adalah galat Tipe II.

Pengujian Hipotesis dengan Python

Galat yang mungkin pada contoh kita

Jika $p \le \alpha$, kita menolak $H_{0}$:

  • False positive (Tipe I): data scientist tidak mulai ngoding saat kecil dengan tingkat lebih tinggi

Jika $ p \gt \alpha$, kita gagal menolak $H_{0}$:

  • False negative (Tipe II): data scientist mulai ngoding saat kecil dengan tingkat lebih tinggi
Pengujian Hipotesis dengan Python

Ayo berlatih!

Pengujian Hipotesis dengan Python

Preparing Video For Download...