Création d'un diagramme en boîte

Introduction à la visualisation de données avec Seaborn

Erin Case

Data Scientist

Qu'est-ce qu'un graphique en boîte ?

  • Montre la distribution des données quantitatives
  • Voir médiane, dispersion, asymétrie et valeurs aberrantes
  • Facilite les comparaisons entre les groupes

Graphique de la facture totale ventilée par jour de la semaine

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Comment créer un graphique en boîte

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box")

plt.show()

Graphique en boîte de la facture totale ventilée par heure de la journée

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Modifier l'ordre des catégories

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                order=["Dinner", 
                       "Lunch"])

plt.show()

Graphique en boîte avec le dîner présenté avant le déjeuner

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Exclusion des valeurs aberrantes à l'aide de `sym`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                sym="")

plt.show()

Graphique en boîte avec suppression des valeurs aberrantes

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Modifier les moustaches à l'aide de `whis`

  • Par défaut, les moustaches s'étendent jusqu'à 1,5 * l'intervalle interquartile
  • Étendez-les à 2,0 * IQR : whis=2.0
  • Indiquer les 5e et 95e percentiles : whis=[5, 95]
  • Afficher les valeurs minimales et maximales : whis=[0, 100]
Introduction à la visualisation de données avec Seaborn

Modifier les moustaches à l'aide de `whis`

import matplotlib.pyplot as plt
import seaborn as sns

g = sns.catplot(x="time", 
                y="total_bill",
                data=tips, 
                kind="box",
                whis=[0, 100])

plt.show()

Graphique en boîte avec moustaches réglées sur le minimum et le maximum

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Passons à la pratique !

Introduction à la visualisation de données avec Seaborn

Preparing Video For Download...