Introducción a los gráficos lineales

Introducción a la visualización de datos con Seaborn

Erin Case

Data Scientist

¿Qué son los gráficos de líneas?

Dos tipos de gráficos relacionales: gráficos de dispersión y gráficos de líneas

Gráficos de dispersión

  • Cada punto del gráfico es una observación independiente

Gráficos de líneas

  • Cada punto del gráfico representa lo mismo, normalmente registrado a lo largo del tiempo

Gráfico lineal de la cotización de las acciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Datos sobre la contaminación atmosférica

  • Puntos de recogida en toda la ciudad
  • Muestras de aire con niveles de dióxido de nitrógeno

Primeras cinco filas de DataFrame sobre contaminación atmosférica

Introducción a la visualización de datos con Seaborn

Diagrama de dispersión

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="scatter")

plt.show()

Gráfico de dispersión del dióxido de nitrógeno medio a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Gráfico lineal

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="line")

plt.show()

Gráfico lineal del dióxido de nitrógeno medio a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Subgrupos por ubicación

Primeras cinco filas de contaminación atmosférica por ubicación DataFrame

Introducción a la visualización de datos con Seaborn

Subgrupos por ubicación

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line",
            style="location", 
            hue="location")

plt.show()

Gráfico de líneas del dióxido de nitrógeno medio a lo largo del tiempo por región

Introducción a la visualización de datos con Seaborn

Añadir marcadores

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True)

plt.show()

Gráfico de líneas con marcadores añadidos

Introducción a la visualización de datos con Seaborn

Desactivar el estilo de línea

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True,
            dashes=False)

plt.show()

Gráfico lineal con marcadores y líneas continuas

Introducción a la visualización de datos con Seaborn

Varias observaciones por valor x

Primeras cinco filas del DataFrame de contaminación atmosférica por estación

Introducción a la visualización de datos con Seaborn

Varias observaciones por valor x

Diagrama de dispersión
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="scatter")

plt.show()

Gráfico de dispersión del dióxido de nitrógeno para todas las estaciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Varias observaciones por valor x

Gráfico lineal
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line")

plt.show()

Gráfico lineal del dióxido de nitrógeno para todas las estaciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Varias observaciones por valor x

La zona sombreada es el intervalo de confianza

  • Supone que el conjunto de datos es una muestra aleatoria
  • 95 % de confianza en que la media se encuentra dentro de este intervalo
  • Indica incertidumbre en nuestra estimación

Gráfico lineal del dióxido de nitrógeno para todas las estaciones a lo largo del tiempo

Introducción a la visualización de datos con Seaborn

Sustitución del intervalo de confianza por la desviación estándar

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            ci="sd")

plt.show()

Gráfico de líneas con desviación estándar

Introducción a la visualización de datos con Seaborn

Desactivar el intervalo de confianza

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            ci=None)

plt.show()

Gráfico de líneas sin intervalo de confianza

Introducción a la visualización de datos con Seaborn

¡Vamos a practicar!

Introducción a la visualización de datos con Seaborn

Preparing Video For Download...