Tests d'hypothèses en Python
James Chapman
Curriculum Manager, DataCamp
Le niveau de signification d’un test ($\alpha$) est le seuil pour « au-delà de tout doute raisonnable »
0.2, 0.1, 0.05, 0.01alpha = 0.05prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean() prop_child_hyp = 0.35std_error = np.std(first_code_boot_distn, ddof=1)
z_score = (prop_child_samp - prop_child_hyp) / std_error
p_value = 1 - norm.cdf(z_score, loc=0, scale=1)
3.1471479512323874e-05
alpha = 0.05print(p_value)
3.1471479512323874e-05
p_value <= alpha
True
Rejeter $H_{0}$ en faveur de $H_{A}$
Pour un niveau de signification $\alpha$, on choisit souvent un niveau d’intervalle de confiance de 1 − $\alpha$
import numpy as np
lower = np.quantile(first_code_boot_distn, 0.025)
upper = np.quantile(first_code_boot_distn, 0.975)
print((lower, upper))
(0.37063246351172047, 0.41132242370632466)
| N’a vraiment pas commis le crime | A vraiment commis le crime | |
|---|---|---|
| Verdict non coupable | correct | il s’en est tiré |
| Verdict coupable | condamnation à tort | correct |
| vrai $H_{0}$ | vrai $H_{A}$ | |
|---|---|---|
| choix $H_{0}$ | correct | faux négatif |
| choix $H_{A}$ | faux positif | correct |
Les faux positifs sont des erreurs de type I ; les faux négatifs, des erreurs de type II.
Si $p \le \alpha$, on rejette $H_{0}$ :
Si $ p \gt \alpha$, on ne rejette pas $H_{0}$ :
Tests d'hypothèses en Python