Abbildungen aus Daten automatisieren

Einführung in die Datenvisualisierung mit Matplotlib

Ariel Rokem

Data Scientist

Warum automatisieren?

  • Einfachheit und Schnelligkeit
  • Flexibilität
  • Robustheit
  • Reproduzierbarkeit
Einführung in die Datenvisualisierung mit Matplotlib

Wie viele verschiedene Arten von Daten?

summer_2016_medals["Sport"]
ID
62            Rowing
65         Taekwondo
73          Handball
             ...
134759      Handball
135132    Volleyball
135205        Boxing
Name: Sport, Length: 976, dtype: object
Einführung in die Datenvisualisierung mit Matplotlib

Eindeutige Werte einer Spalte abrufen

sports = summer_2016_medals["Sport"].unique()

print(sports)
['Rowing' 'Taekwondo' 'Handball' 'Wrestling' 
'Gymnastics' 'Swimming' 'Basketball' 'Boxing' 
'Volleyball' 'Athletics']
Einführung in die Datenvisualisierung mit Matplotlib

Balkendiagramm zu Körpergrößen für alle Sportarten

fig, ax = plt.subplots()

for sport in sports:
  sport_df = summer_2016_medals[summer_2016_medals["Sport"] == sport]

ax.bar(sport, sport_df["Height"].mean(), yerr=sport_df["Height"].std())
ax.set_ylabel("Height (cm)") ax.set_xticklabels(sports, rotation=90) plt.show()
Einführung in die Datenvisualisierung mit Matplotlib

Abbildung wurde automatisch aus Daten abgeleitet

Einführung in die Datenvisualisierung mit Matplotlib

Zeit für ein paar Übungen!

Einführung in die Datenvisualisierung mit Matplotlib

Preparing Video For Download...