Graphiques à points

Introduction à la visualisation de données avec Seaborn

Erin Case

Data Scientist

Qu'est-ce qu'un graphique en points ?

  • Les points indiquent la moyenne de la variable quantitative
  • Les lignes verticales indiquent les intervalles de confiance à 95 %

Graphique en points de la facture moyenne des fumeurs par rapport aux non-fumeurs

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Graphique en ligne : niveau moyen de dioxyde d'azote au fil du temps Graphique en ligne du dioxyde d'azote en fonction du temps

Graphique en points : facture moyenne d'un restaurant, fumeurs vs. non-fumeurs Graphique en points de la facture moyenne des fumeurs par rapport aux non-fumeurs

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Graphiques en points et graphiques linéaires

Les deux montrent :

  • Moyenne de la variable quantitative
  • Intervalles de confiance à 95 % pour la moyenne

Différences :

  • Le graphique linéaire présente une variable quantitative (généralement le temps) sur l'axe des abscisses
  • Le graphique en points comporte une variable catégorielle sur l'axe des abscisses
Introduction à la visualisation de données avec Seaborn

Graphiques en points et graphiques en barres

Les deux montrent :

  • Moyenne de la variable quantitative
  • Intervalles de confiance à 95 % pour la moyenne
Introduction à la visualisation de données avec Seaborn

Graphiques en points et graphiques en barres

Graphique de la masculinité avec teinte

Graphique de la masculinité avec teinte

Introduction à la visualisation de données avec Seaborn

Création d'un graphique en points

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="age", 
            y="masculinity_important", 
            data=masculinity_data,
            hue="feel_masculine",
            kind="point")

plt.show()

Graphique en points de la masculinité avec teinte

Introduction à la visualisation de données avec Seaborn

Déconnexion des points

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="age", 
            y="masculinity_important", 
            data=masculinity_data,
            hue="feel_masculine",
            kind="point",
            join=False)

plt.show()

Graphique en points de la masculinité avec teinte et points déconnectés

Introduction à la visualisation de données avec Seaborn

Affichage de la médiane

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="smoker", 
            y="total_bill", 
            data=tips, 
            kind="point")

plt.show()

Graphique en points de la facture totale moyenne pour les fumeurs et les non-fumeurs

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Affichage de la médiane

import matplotlib.pyplot as plt
import seaborn as sns
from numpy import median

sns.catplot(x="smoker", 
            y="total_bill", 
            data=tips, 
            kind="point", 
            estimator=median)

plt.show()

Graphique en points de la médiane de la facture totale pour les fumeurs et les non-fumeurs

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Personnalisation des intervalles de confiance

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="smoker", 
            y="total_bill", 
            data=tips, 
            kind="point",
            capsize=0.2)

plt.show()

Graphique en points avec des caps sur les intervalles de confiance

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Désactiver les intervalles de confiance

import matplotlib.pyplot as plt
import seaborn as sns

sns.catplot(x="smoker", 
            y="total_bill", 
            data=tips, 
            kind="point",
            ci=None)

plt.show()

Graphique en points sans intervalle de confiance

1 Waskom, M. L. (2021). seaborn : visualisation de données statistiques. https://seaborn.pydata.org/
Introduction à la visualisation de données avec Seaborn

Passons à la pratique !

Introduction à la visualisation de données avec Seaborn

Preparing Video For Download...