Generar hipótesis

Análisis exploratorio de datos en Python

George Boorman

Curriculum Manager, DataCamp

¿Qué sabemos?

Gráfico de recuento que muestra el número de vuelos por aerolínea en diferentes categorías de precios, donde Jet Airways tiene el mayor número de billetes en primera clase

Análisis exploratorio de datos en Python

¿Qué sabemos?

sns.heatmap(planes.corr(numeric_only=True), annot=True)
plt.show()

Mapa de calor que muestra las puntuaciones del coeficiente de correlación de Pearson entre las variables del conjunto de datos de aviones

Análisis exploratorio de datos en Python

Correlación espuria

sns.scatterplot(data=planes, x="Duration", y="Price", hue="Total_Stops")
plt.show()

Gráfico de dispersión del precio frente a la duración, teniendo en cuenta el total de paradas

Análisis exploratorio de datos en Python

¿Cómo lo sabemos?

Mapa de calor con puntuaciones del coeficiente de correlación para cada número de paradas

Análisis exploratorio de datos en Python

¿Qué es cierto?

Máquina de escribir que muestra «Noticias falsas»

  • ¿Los datos de otro momento darían los mismos resultados?

  • Detectar relaciones, diferencias y patrones:

    • Utilizamos pruebas de hipótesis
  • La comprobación de hipótesis requiere, antes de la recopilación de datos:

    • Generar una hipótesis o pregunta
    • Una decisión sobre qué prueba estadística utilizar
1 Crédito de la imagen: https://unsplash.com/@markuswinkler
Análisis exploratorio de datos en Python

Data snooping

 

Oficina con vistas a la pista de aterrizaje de un aeropuerto

Lupa mirando un gráfico de barras

Análisis exploratorio de datos en Python

Generar hipótesis

sns.barplot(data=planes, x="Airline", y="Duration")
plt.show()

Gráfico de barras de duración frente a aerolínea

Análisis exploratorio de datos en Python

Generar hipótesis

sns.barplot(data=planes, x="Destination", y="Price")
plt.show()

Gráfico de barras que muestra el precio medio

Análisis exploratorio de datos en Python

Próximos pasos

  • Diseña el experimento

  • Implica pasos tales como:

    • Seleccionar una muestra
    • Calcular cuántos puntos de datos necesitamos
    • Decidir qué prueba estadística realizar
Análisis exploratorio de datos en Python

¡Vamos a practicar!

Análisis exploratorio de datos en Python

Preparing Video For Download...