Tests d'hypothèses en Python
James Chapman
Curriculum Manager, DataCamp


$H_{0}$ : La rémunération moyenne (USD) est la même pour ceux qui ont commencé enfants et ceux qui ont commencé adultes
$H_{A}$ : La rémunération moyenne (USD) est plus élevée pour ceux qui ont commencé enfants que pour ceux qui ont commencé adultes
Utiliser un test à droite
$\alpha = 0{,}1$
Si $p \le \alpha$, alors on rejette $H_{0}$.
from scipy.stats import norm
1 - norm.cdf(z_score)
$SE(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}}) \approx \sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}$
statistique z : quand on utilise une statistique d’échantillon unique pour estimer un paramètre de population
statistique t : quand on utilise plusieurs statistiques d’échantillon pour estimer un paramètre de population
numerator = xbar_child - xbar_adult
denominator = np.sqrt(s_child ** 2 / n_child + s_adult ** 2 / n_adult)
t_stat = numerator / denominator
1.8699313316221844
degrees_of_freedom = n_child + n_adult - 2
2259
from scipy.stats import t
1 - t.cdf(t_stat, df=degrees_of_freedom)
0.030811302165157595
Tests d'hypothèses en Python