Automating figures from data

Introduzione alla visualizzazione dei dati con Matplotlib

Ariel Rokem

Data Scientist

Why automate?

  • Ease and speed
  • Flexibility
  • Robustness
  • Reproducibility
Introduzione alla visualizzazione dei dati con Matplotlib

How many different kinds of data?

summer_2016_medals["Sport"]
ID
62            Rowing
65         Taekwondo
73          Handball
             ...
134759      Handball
135132    Volleyball
135205        Boxing
Name: Sport, Length: 976, dtype: object
Introduzione alla visualizzazione dei dati con Matplotlib

Getting unique values of a column

sports = summer_2016_medals["Sport"].unique()

print(sports)
['Rowing' 'Taekwondo' 'Handball' 'Wrestling' 
'Gymnastics' 'Swimming' 'Basketball' 'Boxing' 
'Volleyball' 'Athletics']
Introduzione alla visualizzazione dei dati con Matplotlib

Bar-chart of heights for all sports

fig, ax = plt.subplots()

for sport in sports:
  sport_df = summer_2016_medals[summer_2016_medals["Sport"] == sport]

ax.bar(sport, sport_df["Height"].mean(), yerr=sport_df["Height"].std())
ax.set_ylabel("Height (cm)") ax.set_xticklabels(sports, rotation=90) plt.show()
Introduzione alla visualizzazione dei dati con Matplotlib

Figure derived automatically from the data

Introduzione alla visualizzazione dei dati con Matplotlib

Practice automating visualizations!

Introduzione alla visualizzazione dei dati con Matplotlib

Preparing Video For Download...