Significancia estadística

Pruebas de hipótesis en Python

James Chapman

Curriculum Manager, DataCamp

Repaso del p-value

Los p-values cuantifican la evidencia a favor de la hipótesis nula
p-value grande → no rechazar la nula
p-value pequeño → rechazar la nula
¿Dónde está el umbral?

Nivel de significancia

El nivel de significancia de una prueba de hipótesis ($\alpha$) es el umbral para "más allá de toda duda razonable"

Valores comunes de $\alpha$: 0.2, 0.1, 0.05 y 0.01
Si $p \le \alpha$, rechaza $H_{0}$; si no, no rechaza $H_{0}$
Fija $\alpha$ antes de realizar la prueba

Cálculo del p-value

alpha = 0.05

prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean()
prop_child_hyp = 0.35

std_error = np.std(first_code_boot_distn, ddof=1)

z_score = (prop_child_samp - prop_child_hyp) / std_error

p_value = 1 - norm.cdf(z_score, loc=0, scale=1)

3.1471479512323874e-05

Tomar una decisión

alpha = 0.05

print(p_value)

3.1471479512323874e-05

p_value <= alpha

True

Rechaza $H_{0}$ a favor de $H_{A}$

Intervalos de confianza

Para un nivel de significancia $\alpha$, es común usar un nivel de intervalo de confianza de 1 - $\alpha$

$\alpha=0.05$ → intervalo de confianza del $95\%$

import numpy as np
lower = np.quantile(first_code_boot_distn, 0.025)
upper = np.quantile(first_code_boot_distn, 0.975)
print((lower, upper))

(0.37063246351172047, 0.41132242370632466)

Tipos de errores

	No cometió el delito	Sí cometió el delito
Veredicto: inocente	correcto	se salió con la suya
Veredicto: culpable	condena injusta	correcto

	$H_{0}$ verdadero	$H_{A}$ verdadero
se elige $H_{0}$	correcto	falso negativo
se elige $H_{A}$	falso positivo	correcto

Los falsos positivos son errores de tipo I; los falsos negativos, de tipo II.

Posibles errores en nuestro ejemplo

Si $p \le \alpha$, rechazamos $H_{0}$:

Falso positivo (tipo I): los científicos de datos no empezaron a programar de niños con mayor frecuencia

Si $ p \gt \alpha$, no rechazamos $H_{0}$:

Falso negativo (tipo II): los científicos de datos sí empezaron a programar de niños con mayor frecuencia

¡Vamos a practicar!

Pruebas de hipótesis en Python