Introducción a los gráficos de líneas

Introducción a la visualización de datos con Seaborn

Content Team

DataCamp

¿Qué son los gráficos de líneas?

Dos tipos de gráficos relacionales: dispersión y líneas

Gráficos de dispersión

  • Cada punto es una observación independiente

Gráficos de líneas

  • Cada punto representa lo mismo, generalmente a lo largo del tiempo

Gráfico de líneas del precio de acciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Datos de contaminación del aire

  • Estaciones de recolección en toda la ciudad
  • Muestras de aire de niveles de dióxido de nitrógeno

Primeras cinco filas del DataFrame de contaminación del aire

Introducción a la visualización de datos con Seaborn

Gráfico de dispersión

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="scatter")

plt.show()

Gráfico de dispersión del promedio de dióxido de nitrógeno a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Gráfico de líneas

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="line")

plt.show()

Gráfico de líneas del promedio de dióxido de nitrógeno a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Subgrupos por ubicación

Primeras cinco filas del DataFrame de contaminación del aire por ubicación

Introducción a la visualización de datos con Seaborn

Subgrupos por ubicación

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line",
            style="location", 
            hue="location")

plt.show()

Gráfico de líneas del promedio de dióxido de nitrógeno a lo largo del tiempo por región

Introducción a la visualización de datos con Seaborn

Añadiendo marcadores

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True)

plt.show()

Gráfico de líneas con marcadores añadidos

Introducción a la visualización de datos con Seaborn

Desactivar estilo de línea

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True,
            dashes=False)

plt.show()

Gráfico de líneas con marcadores y líneas sólidas

Introducción a la visualización de datos con Seaborn

Múltiples observaciones por valor x

Primeras cinco filas del DataFrame de contaminación del aire por estación

Introducción a la visualización de datos con Seaborn

Múltiples observaciones por valor x

Gráfico de dispersión
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="scatter")

plt.show()

Gráfico de dispersión de dióxido de nitrógeno para todas las estaciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Múltiples observaciones por valor x

Gráfico de líneas
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line")

plt.show()

Gráfico de líneas de dióxido de nitrógeno para todas las estaciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Múltiples observaciones por valor x

La región sombreada es el intervalo de confianza

  • Supone que el conjunto de datos es una muestra aleatoria
  • 95% de confianza de que la media está dentro de este intervalo
  • Indica incertidumbre en nuestra estimación

Gráfico de líneas de dióxido de nitrógeno para todas las estaciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Reemplazar intervalo de confianza con desviación estándar

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar="sd")

plt.show()

Gráfico de líneas con desviación estándar

Introducción a la visualización de datos con Seaborn

Desactivar intervalo de confianza

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar=None)

plt.show()

Gráfico de líneas sin intervalo de confianza

Introducción a la visualización de datos con Seaborn

¡Vamos a practicar!

Introducción a la visualización de datos con Seaborn

Preparing Video For Download...