Automatizar cifras a partir de datos

Introducción a la visualización de datos con Matplotlib

Ariel Rokem

Data Scientist

¿Por qué automatizar?

  • Facilidad y rapidez
  • Flexibilidad
  • Robustez
  • Reproducibilidad
Introducción a la visualización de datos con Matplotlib

¿Cuántos tipos diferentes de datos?

summer_2016_medals["Sport"]
ID
62            Rowing
65         Taekwondo
73          Handball
             ...
134759      Handball
135132    Volleyball
135205        Boxing
Name: Sport, Length: 976, dtype: object
Introducción a la visualización de datos con Matplotlib

Obtener valores únicos de una columna

sports = summer_2016_medals["Sport"].unique()

print(sports)
['Rowing' 'Taekwondo' 'Handball' 'Wrestling' 
'Gymnastics' 'Swimming' 'Basketball' 'Boxing' 
'Volleyball' 'Athletics']
Introducción a la visualización de datos con Matplotlib

Gráfico de barras con las alturas para todos los deportes

fig, ax = plt.subplots()

for sport in sports:
  sport_df = summer_2016_medals[summer_2016_medals["Sport"] == sport]

ax.bar(sport, sport_df["Height"].mean(), yerr=sport_df["Height"].std())
ax.set_ylabel("Height (cm)") ax.set_xticklabels(sports, rotation=90) plt.show()
Introducción a la visualización de datos con Matplotlib

Cifra obtenida automáticamente a partir de los datos.

Introducción a la visualización de datos con Matplotlib

¡Practica la automatización de visualizaciones!

Introducción a la visualización de datos con Matplotlib

Preparing Video For Download...