Hypothesetoetsen in Python
James Chapman
Curriculum Manager, DataCamp
De steekproeven zijn willekeurige subsets van grotere populaties

Elke observatie (rij) in de dataset is onafhankelijk
De steekproef is groot genoeg om onzekerheid te dempen, zodat de centrale limietstelling geldt
$n \ge 30$
$n$: steekproefgrootte
$n_{1} \ge 30, n_{2} \ge 30$
$n_{i}$: steekproefgrootte voor groep $i$
Aantal rijen in onze data $\ge 30$
$n_{i} \ge 30$ voor alle $i$
$n \times \hat{p} \ge 10$
$n \times (1 - \hat{p}) \ge 10$
$n$: steekproefgrootte
$\hat{p}$: aandeel successen in de steekproef
$n_{1} \times \hat{p}_{1} \ge 10$
$n_{2} \times \hat{p}_{2} \ge 10$
$n_{1} \times (1 - \hat{p}_{1}) \ge 10$
$n_{2} \times (1 - \hat{p}_{2}) \ge 10$
$n_{i} \times \hat{p}_{i} \ge 5$ voor alle $i$
$n_{i} \times (1 - \hat{p}_{i}) \ge 5$ voor alle $i$
$n_{i}$: steekproefgrootte voor groep $i$
$\hat{p}_{i}$: aandeel successen in groep $i$
Als de bootstrapverdeling niet normaal oogt, zijn de aannames waarschijnlijk ongeldig
Hypothesetoetsen in Python