Pruebas de hipótesis en Python
James Chapman
Curriculum Manager, DataCamp
Las muestras son subconjuntos aleatorios de poblaciones mayores

Cada observación (fila) del conjunto de datos es independiente
La muestra es lo bastante grande para reducir la incertidumbre y que se aplique el Teorema Central del Límite
$n \ge 30$
$n$: tamaño de muestra
$n_{1} \ge 30, n_{2} \ge 30$
$n_{i}$: tamaño de muestra del grupo $i$
Número de filas en los datos $\ge 30$
$n_{i} \ge 30$ para todo $i$
$n \times \hat{p} \ge 10$
$n \times (1 - \hat{p}) \ge 10$
$n$: tamaño de muestra
$\hat{p}$: proporción de éxitos en la muestra
$n_{1} \times \hat{p}_{1} \ge 10$
$n_{2} \times \hat{p}_{2} \ge 10$
$n_{1} \times (1 - \hat{p}_{1}) \ge 10$
$n_{2} \times (1 - \hat{p}_{2}) \ge 10$
$n_{i} \times \hat{p}_{i} \ge 5$ para todo $i$
$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ para todo $i$
$n_{i}$: tamaño de muestra del grupo $i$
$\hat{p}_{i}$: proporción de éxitos en el grupo $i$
Si la distribución bootstrap no parece normal, los supuestos probablemente no se cumplen
Pruebas de hipótesis en Python