La distribución normal

Introducción a la estadística en Python

Maggie Matsui

Content Developer, DataCamp

¿Qué es la distribución normal?

Función de densidad de la distribución normal

Introducción a la estadística en Python

Simétrica

Línea vertical discontinua en el centro de la distribución normal

Introducción a la estadística en Python

Área = 1

Distribución normal con el área bajo la curva sombreada

Introducción a la estadística en Python

La curva nunca llega a 0

Distribución normal con flechas que señalan las colas a ambos lados

Introducción a la estadística en Python

Se describe mediante la media y la desviación típica

 

                                                         Media: 20

                                        Desviación típica: 3

Distribución normal con media de 20 y desviación típica de 3

                         Distribución normal estándar

                                                         Media: 0

                                        Desviación típica: 1

Distribución normal con media de 0 y desviación típica de 1

Introducción a la estadística en Python

Se describe mediante la media y la desviación típica

 

                                                         Media: 20

                                        Desviación típica: 3

Distribución normal con media de 20 y desviación típica de 3

                         Distribución normal estándar

                                                         Media: 0

                                        Desviación típica: 1

Distribución normal con media de 0 y desviación típica de 1

Introducción a la estadística en Python

Áreas bajo la distribución normal

El 68 % está dentro de una desviación típica

Distribución normal con el área entre -1 y 1 resaltada, etiquetada como 68 %

Introducción a la estadística en Python

Áreas bajo la distribución normal

El 95 % se encuentra dentro de las 2 desviaciones típicas

Distribución normal con el área entre -2 y 2 resaltada, etiquetada como 95 %

Introducción a la estadística en Python

Áreas bajo la distribución normal

El 99,7 % está dentro de las 3 desviaciones típicas

Distribución normal con el área entre -3 y 3 resaltada, etiquetada como 99,7 %

Introducción a la estadística en Python

Muchos histogramas parecen normales

Distribución normal

Distribución normal estándar

Estatura de las mujeres según la NHANES

Histograma de la estatura de las mujeres

Media: 161 cm        Desviación típica: 7 cm

Introducción a la estadística en Python

Aproximación de datos con la distribución normal

Curva normal trazada sobre el histograma de la estatura de las mujeres

Introducción a la estadística en Python

¿Qué porcentaje de mujeres mide menos de 154 cm?

Curva normal trazada sobre el histograma de la estatura de las mujeres con el área inferior a 154 sombreada

El 16 % de las mujeres encuestadas miden menos de 154 cm

from scipy.stats import norm
norm.cdf(154, 161, 7)
0.158655
Introducción a la estadística en Python

¿Qué porcentaje de mujeres mide más de 154 cm?

Curva normal trazada sobre el histograma de la estatura de las mujeres con el área a la derecha de 154 sombreada

from scipy.stats import norm
1 - norm.cdf(154, 161, 7)
0.841345
Introducción a la estadística en Python

¿Qué porcentaje de mujeres miden 154-157 cm?

Área inferior a 157 menos área inferior a 154

norm.cdf(157, 161, 7) - norm.cdf(154, 161, 7)
Introducción a la estadística en Python

¿Qué porcentaje de mujeres miden 154-157 cm?

El área inferior a 157 menos el área inferior a 154 es igual al área comprendida entre 154 y 157

norm.cdf(157, 161, 7) - norm.cdf(154, 161, 7)
0.1252
Introducción a la estadística en Python

¿Cuál es la estatura del 90 % de las mujeres?

Área inferior a 170 sombreada, etiquetada como 90 %

norm.ppf(0.9, 161, 7)
169.97086
Introducción a la estadística en Python

¿Qué altura supera el 90 % de las mujeres?

Área mayor que aproximadamente 162 sombreada, etiquetada como 90 %

norm.ppf((1-0.9), 161, 7)
152.029
Introducción a la estadística en Python

Generar números aleatorios

# Generate 10 random heights
norm.rvs(161, 7, size=10)
array([155.5758223 , 155.13133235, 160.06377097, 168.33345778,
       165.92273375, 163.32677057, 165.13280753, 146.36133538,
       149.07845021, 160.5790856 ])
Introducción a la estadística en Python

¡Vamos a practicar!

Introducción a la estadística en Python

Preparing Video For Download...