Ajouter une troisième variable avec la teinte

Introduction à la visualisation de données avec Seaborn

Erin Case

Data Scientist

Ensemble de données sur les pourboires

import pandas as pd
import seaborn as sns

tips = sns.load_dataset("tips")
tips.head()
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Un graphique de dispersion de base

import matplotlib.pyplot as plt
import seaborn as sns

sns.scatterplot(x="total_bill", 
                y="tip", 
                data=tips)

plt.show()

Graphique de la facture totale par rapport au montant des pourboires

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Un graphique de dispersion avec teinte

import matplotlib.pyplot as plt
import seaborn as sns

sns.scatterplot(x="total_bill", 
                y="tip", 
                data=tips,
                hue="smoker")

plt.show()

Graphique de dispersion avec des points colorés en fonction du statut tabagique

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Réglage de l'ordre des teintes

import matplotlib.pyplot as plt
import seaborn as sns

sns.scatterplot(x="total_bill", 
                y="tip", 
                data=tips,
                hue="smoker",
                hue_order=["Yes", 
                           "No"])

plt.show()

Graphique de dispersion avec les fumeurs avant les non-fumeurs dans la légende

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Spécification des couleurs de teinte

import matplotlib.pyplot as plt
import seaborn as sns

hue_colors = {"Yes": "black", "No": "red"}
sns.scatterplot(x="total_bill", y="tip", data=tips, hue="smoker", palette=hue_colors) plt.show()

Graphique de dispersion avec des couleurs noires et rouges

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Table des noms de couleurs et des codes hexadécimaux

Introduction à la visualisation de données avec Seaborn

Utilisation des codes de couleur hexadécimales HTML avec teinte

import matplotlib.pyplot as plt
import seaborn as sns

hue_colors = {"Yes": "#808080", 
              "No": "#00FF00"}

sns.scatterplot(x="total_bill", 
                y="tip", 
                data=tips,
                hue="smoker",
                palette=hue_colors)

plt.show()

Graphique de dispersion avec couleurs hexadécimales

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Utilisation de la teinte avec les graphiques de comptage

import matplotlib.pyplot as plt
import seaborn as sns

sns.countplot(x="smoker", 
              data=tips, 
              hue="sex")

plt.show()

Graphique de comptage du statut tabagique avec des sous-groupes d'hommes et de femmes

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Passons à la pratique !

Introduction à la visualisation de données avec Seaborn

Preparing Video For Download...