Introduction aux graphiques en ligne

Introduction à la visualisation de données avec Seaborn

Content Team

DataCamp

Qu'est-ce qu'un graphique en ligne ?

Deux types de graphiques relationnels : nuages de points et graphiques en ligne

Nuages de points

  • Chaque point est une observation indépendante

Graphiques en ligne

  • Chaque point représente la même "chose", généralement suivie dans le temps

Graphique en ligne du prix des actions au fil du temps

Introduction à la visualisation de données avec Seaborn

Données sur la pollution de l'air

  • Stations de collecte dans toute la ville
  • Échantillons d'air des niveaux de dioxyde d'azote

Premières cinq lignes du DataFrame de pollution de l'air

Introduction à la visualisation de données avec Seaborn

Nuage de points

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="scatter")

plt.show()

Nuage de points de la moyenne de dioxyde d'azote au fil du temps

Introduction à la visualisation de données avec Seaborn

Graphique en ligne

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_mean, 
            kind="line")

plt.show()

Graphique en ligne de la moyenne de dioxyde d'azote au fil du temps

Introduction à la visualisation de données avec Seaborn

Sous-groupes par emplacement

Premières cinq lignes du DataFrame de pollution de l'air par emplacement

Introduction à la visualisation de données avec Seaborn

Sous-groupes par emplacement

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line",
            style="location", 
            hue="location")

plt.show()

Graphique en ligne de la moyenne de dioxyde d'azote au fil du temps par région

Introduction à la visualisation de données avec Seaborn

Ajout de marqueurs

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True)

plt.show()

Graphique en ligne avec marqueurs ajoutés

Introduction à la visualisation de données avec Seaborn

Désactiver le style de ligne

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2_mean", 
            data=air_df_loc_mean, 
            kind="line", 
            style="location", 
            hue="location",
            markers=True,
            dashes=False)

plt.show()

Graphique en ligne avec marqueurs et lignes pleines

Introduction à la visualisation de données avec Seaborn

Observations multiples par valeur x

Premières cinq lignes du DataFrame de pollution de l'air par station

Introduction à la visualisation de données avec Seaborn

Observations multiples par valeur x

Nuage de points
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="scatter")

plt.show()

Nuage de points de dioxyde d'azote pour toutes les stations au fil du temps

Introduction à la visualisation de données avec Seaborn

Observations multiples par valeur x

Graphique en ligne
import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line")

plt.show()

Graphique en ligne de dioxyde d'azote pour toutes les stations au fil du temps

Introduction à la visualisation de données avec Seaborn

Observations multiples par valeur x

La région ombrée est l'intervalle de confiance

  • Suppose que le jeu de données est un échantillon aléatoire
  • 95 % de confiance que la moyenne est dans cet intervalle
  • Indique l'incertitude de notre estimation

Graphique en ligne de dioxyde d'azote pour toutes les stations au fil du temps

Introduction à la visualisation de données avec Seaborn

Remplacer l'intervalle de confiance par l'écart-type

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar="sd")

plt.show()

Graphique en ligne avec écart-type

Introduction à la visualisation de données avec Seaborn

Désactiver l'intervalle de confiance

import matplotlib.pyplot as plt
import seaborn as sns

sns.relplot(x="hour", y="NO_2", 
            data=air_df, 
            kind="line",
            errorbar=None)

plt.show()

Graphique en ligne sans intervalle de confiance

Introduction à la visualisation de données avec Seaborn

Passons à la pratique !

Introduction à la visualisation de données avec Seaborn

Preparing Video For Download...