Signifikansi statistik

Pengujian Hipotesis dengan Python

James Chapman

Curriculum Manager, DataCamp

Ulangan p-value

p-value mengukur bukti untuk hipotesis nol
p-value besar → gagal menolak hipotesis nol
p-value kecil → tolak hipotesis nol
Titik batasnya di mana?

Tingkat signifikansi

Tingkat signifikansi uji hipotesis ($\alpha$) adalah ambang untuk "melampaui keraguan wajar"

Nilai $\alpha$ umum: 0.2, 0.1, 0.05, dan 0.01
Jika $p \le \alpha$, tolak $H_{0}$; jika tidak, gagal menolak $H_{0}$
$\alpha$ harus ditetapkan sebelum menjalankan uji hipotesis

Menghitung p-value

alpha = 0.05

prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean()
prop_child_hyp = 0.35

std_error = np.std(first_code_boot_distn, ddof=1)

z_score = (prop_child_samp - prop_child_hyp) / std_error

p_value = 1 - norm.cdf(z_score, loc=0, scale=1)

3.1471479512323874e-05

Membuat keputusan

alpha = 0.05

print(p_value)

3.1471479512323874e-05

p_value <= alpha

True

Tolak $H_{0}$ demi $H_{A}$

Interval kepercayaan

Untuk tingkat signifikansi $\alpha$, umum memilih tingkat interval kepercayaan 1 - $\alpha$

$\alpha=0.05$ → interval kepercayaan $95\%$

import numpy as np
lower = np.quantile(first_code_boot_distn, 0.025)
upper = np.quantile(first_code_boot_distn, 0.975)
print((lower, upper))

(0.37063246351172047, 0.41132242370632466)

Jenis galat

	Benar-benar tidak melakukan kejahatan	Benar-benar melakukan kejahatan
Vonis tidak bersalah	benar	lolos tanpa hukuman
Vonis bersalah	salah vonis	benar

	$H_{0}$ sebenarnya	$H_{A}$ sebenarnya
memilih $H_{0}$	benar	false negative
memilih $H_{A}$	false positive	benar

False positive adalah galat Tipe I; false negative adalah galat Tipe II.

Galat yang mungkin pada contoh kita

Jika $p \le \alpha$, kita menolak $H_{0}$:

False positive (Tipe I): data scientist tidak mulai ngoding saat kecil dengan tingkat lebih tinggi

Jika $ p \gt \alpha$, kita gagal menolak $H_{0}$:

False negative (Tipe II): data scientist mulai ngoding saat kecil dengan tingkat lebih tinggi

Ayo berlatih!

Pengujian Hipotesis dengan Python