Creando un diagrama de caja

Introducción a la visualización de datos con Seaborn

Content Team

DataCamp

¿Qué es un diagrama de caja?

  • Muestra la distribución de datos cuantitativos
  • Ve mediana, dispersión, asimetría y valores atípicos
  • Facilita comparaciones entre grupos

Diagrama de caja de la cuenta total por día de la semana

1 Waskom, M. L. (2021). seaborn: visualización estadística de datos. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Cómo crear un diagrama de caja

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box")

plt.show()

Diagrama de caja de la cuenta total por hora del día

1 Waskom, M. L. (2021). seaborn: visualización estadística de datos. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Cambiar el orden de categorías

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                order=["Dinner", 
                       "Lunch"])

plt.show()

Diagrama de caja con cena antes del almuerzo

1 Waskom, M. L. (2021). seaborn: visualización estadística de datos. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Omitiendo los valores atípicos

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                showfliers=False)

plt.show()

Diagrama de caja sin valores atípicos

1 Waskom, M. L. (2021). seaborn: visualización estadística de datos. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

Cambiando los bigotes con `whis`

  • Por defecto, los bigotes se extienden a 1.5 * el rango intercuartil
  • Extiéndelos a 2.0 * IQR: whis=2.0
  • Muestra los percentiles 5 y 95: whis=[5, 95]
  • Muestra valores mínimos y máximos: whis=[0, 100]
Introducción a la visualización de datos con Seaborn

Cambiando los bigotes con `whis`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                whis=[0, 100])

plt.show()

Diagrama de caja con bigotes en mínimo y máximo

1 Waskom, M. L. (2021). seaborn: visualización estadística de datos. https://seaborn.pydata.org/
Introducción a la visualización de datos con Seaborn

¡Vamos a practicar!

Introducción a la visualización de datos con Seaborn

Preparing Video For Download...