Como criar um diagrama de caixa

Introdução à Visualização de Dados com o Seaborn

Erin Case

Data Scientist

O que é um diagrama de caixa?

  • Mostra a distribuição de dados quantitativos
  • Permite ver a mediana, a dispersão, a assimetria e valores discrepantes
  • Facilita comparações entre grupos

Diagrama de caixa do total da conta dividido por dia da semana

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introdução à Visualização de Dados com o Seaborn

Como fazer um diagrama de caixa

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box")

plt.show()

Diagrama de caixa do total da conta dividido por hora do dia

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introdução à Visualização de Dados com o Seaborn

Mude a ordem das categorias

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                order=["Dinner", 
                       "Lunch"])

plt.show()

Diagrama de caixa com o jantar mostrado antes do almoço

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introdução à Visualização de Dados com o Seaborn

Como omitir valores discrepantes usando `sym`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                sym="")

plt.show()

Diagrama de caixa com valores discrepantes omitidos

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introdução à Visualização de Dados com o Seaborn

Como alterar os bigodes usando `whis`

  • Por padrão, os bigodes vão até 1,5 vezes o intervalo interquartil.
  • Para que se estendam até 2,0 * IQR: whis=2.0
  • Para mostrar os percentis 5 e 95: whis=[5, 95]
  • Para mostrar os valores mínimo e máximo: whis=[0, 100]
Introdução à Visualização de Dados com o Seaborn

Como alterar os bigodes usando `whis`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                whis=[0, 100])

plt.show()

Diagrama de caixa com bigodes configurados como o mínimo e o máximo

1 Waskom, M. L. (2021). seaborn: statistical data visualization. https://seaborn.pydata.org/
Introdução à Visualização de Dados com o Seaborn

Vamos praticar!

Introdução à Visualização de Dados com o Seaborn

Preparing Video For Download...