Crear un diagrama de cajas

Introducción a la visualización de datos con Seaborn

Erin Case

Data Scientist

¿Qué es un gráfico de caja?

  • Muestra la distribución de datos cuantitativos
  • Se ven la mediana, la dispersión, la asimetría y ols valores atípicos
  • Facilita las comparaciones entre grupos

Gráfico de caja del total de facturas desglosadas por día de la semana

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Cómo crear un gráfico de caja

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box")

plt.show()

Gráfico de caja del total de facturas desglosadas por hora del día

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Cambiar el orden de las categorías

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                order=["Dinner", 
                       "Lunch"])

plt.show()

Gráfico de caja con la cena mostrada antes del almuerzo

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Omitir los valores atípicos con `sym`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                sym="")

plt.show()

Gráfico de caja con valores atípicos omitidos

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Cambiar los bigotes con `whis`

  • De forma predeterminada, los bigotes se extienden hasta 1,5 veces el rango intercuartílico.
  • Haz que se extiendan a 2,0 * IQR: whis=2.0
  • Mostrar los percentiles 5 y 95: whis=[5, 95]
  • Mostrar valores mínimos y máximos: whis=[0, 100]
Introducción a la visualización de datos con Seaborn

Cambiar los bigotes con `whis`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                whis=[0, 100])

plt.show()

Gráfico de caja con bigotes establecidos en el mínimo y el máximo

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

¡Vamos a practicar!

Introducción a la visualización de datos con Seaborn

Preparing Video For Download...