Significancia estadística

Pruebas de hipótesis en Python

James Chapman

Curriculum Manager, DataCamp

Repaso del p-value

  • Los p-values cuantifican la evidencia a favor de la hipótesis nula
  • p-value grande → no rechazar la nula
  • p-value pequeño → rechazar la nula
  • ¿Dónde está el umbral?
Pruebas de hipótesis en Python

Nivel de significancia

El nivel de significancia de una prueba de hipótesis ($\alpha$) es el umbral para "más allá de toda duda razonable"

  • Valores comunes de $\alpha$: 0.2, 0.1, 0.05 y 0.01
  • Si $p \le \alpha$, rechaza $H_{0}$; si no, no rechaza $H_{0}$
  • Fija $\alpha$ antes de realizar la prueba
Pruebas de hipótesis en Python

Cálculo del p-value

alpha = 0.05

prop_child_samp = (stack_overflow['age_first_code_cut'] == "child").mean() prop_child_hyp = 0.35
std_error = np.std(first_code_boot_distn, ddof=1)
z_score = (prop_child_samp - prop_child_hyp) / std_error
p_value = 1 - norm.cdf(z_score, loc=0, scale=1)
3.1471479512323874e-05
Pruebas de hipótesis en Python

Tomar una decisión

alpha = 0.05

print(p_value)
3.1471479512323874e-05
p_value <= alpha
True

Rechaza $H_{0}$ a favor de $H_{A}$

Pruebas de hipótesis en Python

Intervalos de confianza

Para un nivel de significancia $\alpha$, es común usar un nivel de intervalo de confianza de 1 - $\alpha$

  • $\alpha=0.05$ → intervalo de confianza del $95\%$
import numpy as np
lower = np.quantile(first_code_boot_distn, 0.025)
upper = np.quantile(first_code_boot_distn, 0.975)
print((lower, upper))
(0.37063246351172047, 0.41132242370632466)
Pruebas de hipótesis en Python

Tipos de errores

No cometió el delito Sí cometió el delito
Veredicto: inocente correcto se salió con la suya
Veredicto: culpable condena injusta correcto

 

$H_{0}$ verdadero $H_{A}$ verdadero
se elige $H_{0}$ correcto falso negativo
se elige $H_{A}$ falso positivo correcto

 

Los falsos positivos son errores de tipo I; los falsos negativos, de tipo II.

Pruebas de hipótesis en Python

Posibles errores en nuestro ejemplo

Si $p \le \alpha$, rechazamos $H_{0}$:

  • Falso positivo (tipo I): los científicos de datos no empezaron a programar de niños con mayor frecuencia

Si $ p \gt \alpha$, no rechazamos $H_{0}$:

  • Falso negativo (tipo II): los científicos de datos sí empezaron a programar de niños con mayor frecuencia
Pruebas de hipótesis en Python

¡Vamos a practicar!

Pruebas de hipótesis en Python

Preparing Video For Download...