Como automatizar figuras baseadas em dados

Introdução à Visualização de Dados com a Matplotlib

Ariel Rokem

Data Scientist

Por que automatizar?

  • Facilidade e rapidez
  • Flexibilidade
  • Robustez
  • Reprodutibilidade
Introdução à Visualização de Dados com a Matplotlib

Quantos tipos diferentes de dados?

summer_2016_medals["Sport"]
ID
62            Rowing
65         Taekwondo
73          Handball
             ...
134759      Handball
135132    Volleyball
135205        Boxing
Name: Sport, Length: 976, dtype: object
Introdução à Visualização de Dados com a Matplotlib

Pegando valores únicos de uma coluna

sports = summer_2016_medals["Sport"].unique()

print(sports)
['Rowing' 'Taekwondo' 'Handball' 'Wrestling' 
'Gymnastics' 'Swimming' 'Basketball' 'Boxing' 
'Volleyball' 'Athletics']
Introdução à Visualização de Dados com a Matplotlib

Gráfico de barras com as alturas para todos os esportes

fig, ax = plt.subplots()

for sport in sports:
  sport_df = summer_2016_medals[summer_2016_medals["Sport"] == sport]

ax.bar(sport, sport_df["Height"].mean(), yerr=sport_df["Height"].std())
ax.set_ylabel("Height (cm)") ax.set_xticklabels(sports, rotation=90) plt.show()
Introdução à Visualização de Dados com a Matplotlib

Valor calculado automaticamente a partir dos dados

Introdução à Visualização de Dados com a Matplotlib

Pratique automatizar visualizações!

Introdução à Visualização de Dados com a Matplotlib

Preparing Video For Download...