Errores estándar y Teorema Central del Límite

Muestreo en Python

James Chapman

Curriculum Manager, DataCamp

Distribución muestral de puntos de taza medios

Tamaño de muestra: 5 Histograma de la distribución muestral aproximada de puntos de taza medios con tamaño de muestra 5.

Tamaño de muestra: 20 Histograma de la distribución muestral aproximada de puntos de taza medios con tamaño de muestra 20.

Tamaño de muestra: 80 Histograma de la distribución muestral aproximada de puntos de taza medios con tamaño de muestra 80.

Tamaño de muestra: 320 Histograma de la distribución muestral aproximada de puntos de taza medios con tamaño de muestra 320.

Muestreo en Python

Consecuencias del teorema central del límite

 

Las medias de muestras independientes tienen distribuciones aproximadamente normales.

 

A medida que crece el tamaño muestral,

  • La distribución de las medias se acerca a la normalidad

  • La anchura de la distribución muestral se vuelve más estrecha

Muestreo en Python

Medias: población y distribución muestral

coffee_ratings['total_cup_points'].mean()
82.15120328849028

Usa np.mean() en cada distribución muestral aproximada:

Tamaño de muestra Media de la media muestral
5 82.18420719999999
20 82.1558634
80 82.14510154999999
320 82.154017925
Muestreo en Python

Desviaciones típicas: población y distribución muestral

coffee_ratings['total_cup_points'].std(ddof=0)
2.685858187306438

 

  • Especifica ddof=0 al llamar a .std() en poblaciones
  • Especifica ddof=1 al llamar a np.std() en muestras o distribuciones muestrales
Tamaño de muestra Desv. típ. de la media muestral
5 1.1886358227738543
20 0.5940321141669805
80 0.2934024263916487
320 0.13095083089190876
Muestreo en Python

Población dividida por la raíz del tamaño muestral

Tamaño de muestra Desv. típ. de la media muestral Cálculo Resultado
5 1.1886358227738543 2.685858187306438 / sqrt(5) 1.201
20 0.5940321141669805 2.685858187306438 / sqrt(20) 0.601
80 0.2934024263916487 2.685858187306438 / sqrt(80) 0.300
320 0.13095083089190876 2.685858187306438 / sqrt(320) 0.150
Muestreo en Python

Error estándar

  • Desviación típica de la distribución muestral
  • Herramienta clave para entender la variabilidad muestral
Muestreo en Python

¡Vamos a practicar!

Muestreo en Python

Preparing Video For Download...