Automatisation des chiffres à partir des données

Introduction à la visualisation de données avec Matplotlib

Ariel Rokem

Data Scientist

Pourquoi automatiser ?

  • Facilité et rapidité
  • Flexibilité
  • Robustesse
  • Reproductibilité
Introduction à la visualisation de données avec Matplotlib

Combien de types de données différents existe-t-il ?

summer_2016_medals["Sport"]
ID
62            Rowing
65         Taekwondo
73          Handball
             ...
134759      Handball
135132    Volleyball
135205        Boxing
Name: Sport, Length: 976, dtype: object
Introduction à la visualisation de données avec Matplotlib

Obtenir les valeurs uniques d'une colonne

sports = summer_2016_medals["Sport"].unique()

print(sports)
['Rowing' 'Taekwondo' 'Handball' 'Wrestling' 
'Gymnastics' 'Swimming' 'Basketball' 'Boxing' 
'Volleyball' 'Athletics']
Introduction à la visualisation de données avec Matplotlib

Diagramme à barres représentant les hauteurs pour tous les sports

fig, ax = plt.subplots()

for sport in sports:
  sport_df = summer_2016_medals[summer_2016_medals["Sport"] == sport]

ax.bar(sport, sport_df["Height"].mean(), yerr=sport_df["Height"].std())
ax.set_ylabel("Height (cm)") ax.set_xticklabels(sports, rotation=90) plt.show()
Introduction à la visualisation de données avec Matplotlib

Figure calculée automatiquement à partir des données

Introduction à la visualisation de données avec Matplotlib

Entraînez-vous à automatiser les visualisations.

Introduction à la visualisation de données avec Matplotlib

Preparing Video For Download...