¿Qué es la estadística?

Introducción a la estadística en Python

Maggie Matsui

Content Developer, DataCamp

¿Qué es la estadística?

  • El campo de la estadística: la práctica y el estudio de la recogida y el análisis de datos

  • Estadística de resumen: un hecho o resumen de unos datos

Introducción a la estadística en Python

¿Para qué sirve la estadística?

¿Qué es la estadística?

  • El campo de la estadística: la práctica y el estudio de la recogida y el análisis de datos

  • Estadística de resumen: un hecho o resumen de unos datos

¿Para qué sirve la estadística?

  • ¿Qué probabilidad hay de que alguien compre un producto? ¿Es más probable que la gente lo compre si puede utilizar un sistema de pago diferente?
  • ¿Cuántos clientes se alojarán en tu hotel? ¿Cómo puedes optimizar la ocupación?
  • ¿Cuántas tallas de vaqueros hay que fabricar para que le quepan al 95 % de la población? ¿Debe producirse el mismo número de cada tamaño?
  • Pruebas A/B: ¿qué anuncio es más eficaz para conseguir que la gente compre un producto?
Introducción a la estadística en Python

¿Para qué NO sirve la estadística?

  • ¿Por qué es tan popular Juego de Tronos?

En su lugar...

  • ¿Las series con escenas más violentas las ve más gente?

Pero...

  • Aun así, esto no puede decirnos si las escenas más violentas se ven más
Introducción a la estadística en Python

Tipos de estadística

Estadística descriptiva

  • Describe y resume datos

2 coches, 1 autobús, 1 bici

  • El 50 % de los amigos van a trabajar en coche
  • El 25 % coge el autobús
  • El 25 % va en bici

Estadística inferencial

  • Utiliza una muestra de datos para hacer inferencias sobre una población mayor

2 coches, 1 autobús y 1 bici rodeados de más coches, autobuses y bicis

¿Qué porcentaje de personas van a trabajar en coche?

Introducción a la estadística en Python

Tipos de datos

Numéricos (cuantitativos)

  • Continuos (medidos)
    • Velocidad de un avión
    • Tiempo de espera en la cola
  • Discretos (contados)
    • Número de mascotas
    • Número de paquetes enviados

Categóricos (cualitativos)

  • Nominales (sin ordenar)
    • Casado/soltero
    • País de residencia
  • Ordinales (ordenado)

muy en desacuerdo/algo en desacuerdo/ni de acuerdo ni en desacuerdo/algo de acuerdo/muy de acuerdo

Introducción a la estadística en Python

Los datos categóricos pueden representarse como números

Nominales (sin ordenar)

  • Casado/soltero (1/0)
  • País de residencia (1, 2,...)

Ordinales (ordenados)

  • Muy en desacuerdo (1)
  • Algo en desacuerdo (2)
  • Ni de acuerdo ni en desacuerdo (3)
  • Algo de acuerdo (4)
  • Muy de acuerdo (5)
Introducción a la estadística en Python

¿Por qué importa el tipo de datos?

Estadística de resumen
import numpy as np
np.mean(car_speeds['speed_mph'])
40.09062
Gráficos

diagrama de dispersión de la velocidad del coche frente al peso del coche

Introducción a la estadística en Python

¿Por qué importa el tipo de datos?

Estadística de resumen
demographics['marriage_status'].value_counts()
single      188
married     143
divorced    124
dtype: int64
Gráficos

gráfico de barras con el recuento del estado civil

Introducción a la estadística en Python

¡Vamos a practicar!

Introducción a la estadística en Python

Preparing Video For Download...