Tests d'hypothèses en Python
James Chapman
Curriculum Manager, DataCamp
Les échantillons sont des sous-ensembles aléatoires de populations plus larges

Chaque observation (ligne) du jeu de données est indépendante
L’échantillon est assez grand pour réduire l’incertitude, donc le théorème central limite s’applique
$n \ge 30$
$n$ : taille d’échantillon
$n_{1} \ge 30, n_{2} \ge 30$
$n_{i}$ : taille d’échantillon du groupe $i$
Nombre de lignes dans nos données $\ge 30$
$n_{i} \ge 30$ pour tout $i$
$n \times \hat{p} \ge 10$
$n \times (1 - \hat{p}) \ge 10$
$n$ : taille d’échantillon
$\hat{p}$ : proportion de succès dans l’échantillon
$n_{1} \times \hat{p}_{1} \ge 10$
$n_{2} \times \hat{p}_{2} \ge 10$
$n_{1} \times (1 - \hat{p}_{1}) \ge 10$
$n_{2} \times (1 - \hat{p}_{2}) \ge 10$
$n_{i} \times \hat{p}_{i} \ge 5$ pour tout $i$
$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ pour tout $i$
$n_{i}$ : taille d’échantillon du groupe $i$
$\hat{p}_{i}$ : proportion de succès dans le groupe $i$
Si la distribution bootstrap n’est pas normale, les hypothèses sont probablement invalides
Tests d'hypothèses en Python