Ein Diagramm sagt mehr als tausend Worte

Datenvisualisierung verstehen

Richie Cotton

Data Evangelist at DataCamp

Was du lernen wirst

  • Wie du eine geeignete Diagrammart auswählst
  • Wie du die gängigen Arten von Diagrammen interpretierst
  • Die Best Practices zum Erstellen von Diagrammen
Datenvisualisierung verstehen

Drei Möglichkeiten, Erkenntnisse zu gewinnen

Berechnung zusammenfassender Statistiken

Mittelwert, Median, Standardabweichung

Anwendung von Modellen

Lineare und logistische Regression

Erstellen von Diagrammen

Streudiagramm, Balkendiagramm, Histogramm

Datenvisualisierung verstehen

Das Datasaurus-Dutzend

away_x away_y bullseye_x bullseye_y ... x_shape_x x_shape_y
32,33 61,41 51,20 83,34 ... 38,34 92,47
53,42 26,19 58,97 85,50 ... 35,75 94,12
63,92 30,83 51,87 85,83 ... 32,77 88,52
70,29 82,53 48,18 85,05 ... 33,73 88,62
34,12 45,73 41,68 84,02 ... 37,24 83,72
67,67 37,11 37,89 82,57 ... 36,03 82,04
1 Matejka, J., & Fitzmaurice, G. (2017) https://www.autodeskresearch.com/publications/samestats
Datenvisualisierung verstehen

Mittelwert von x für jeden Datensatz

Datensatz mittelwert(x)
away 54,27
bullseye 54,27
circle 54,27
dino 54,26
dots 54,26
h_lines 54,26
high_lines 54,27
Datensatz mittelwert(x)
slant_down 54,27
slant_up 54,27
Stern 54,27
v_lines 54,27
wide_lines 54,27
x_shape 54,26
Datenvisualisierung verstehen

Mittelwert von x und y für jeden Datensatz

Datensatz mittelwert(x) mittelwert(y)
away 54,27 47,83
bullseye 54,27 47,83
circle 54,27 47,84
dino 54,26 47,83
dots 54,26 47,84
h_lines 54,26 47,83
high_lines 54,27 47,84
Datensatz mittelwert(x) mittelwert(y)
slant_down 54,27 47,84
slant_up 54,27 47,83
Stern 54,27 47,84
v_lines 54,27 47,84
wide_lines 54,27 47,83
x_shape 54,26 47,84
Datenvisualisierung verstehen

Standardabweichungen für jeden Datensatz

Datensatz std_abw(x) std_abw(y)
away 16,77 26,94
bullseye 16,77 26,94
circle 16,76 26,93
dino 16,77 26,94
dots 16,77 26,93
h_lines 16,77 26,94
high_lines 16,77 26,94
Datensatz std_abw(x) std_abw(y)
slant_down 16,77 26,94
slant_up 16,77 26,94
Stern 16,77 26,93
v_lines 16,77 26,94
wide_lines 16,77 26,94
x_shape 16,77 26,93
Datenvisualisierung verstehen

Streudiagramme der 13 Datensätze im Datasaurus-Dutzend. Jeder Datensatz sieht ganz anders aus als die anderen.

Datenvisualisierung verstehen

Kontinuierliche und kategoriale Variablen

Kontinuierlich: meist Zahlen

  • Höhen, Temperaturen, Einnahmen
Datenvisualisierung verstehen

Kontinuierliche und kategoriale Variablen

Kontinuierlich: meist Zahlen

  • Höhen, Temperaturen, Einnahmen

Kategorial: meist Text

  • Augenfarben, Länder, Branche
Datenvisualisierung verstehen

Kontinuierliche und kategoriale Variablen

Kontinuierlich: meist Zahlen

  • Höhen, Temperaturen, Einnahmen

Kategorial: meist Text

  • Augenfarben, Länder, Branche

Kann beides sein

  • Alter ist kontinuierlich, aber die Altersgruppe ist kategorial
  • Zeit ist kontinuierlich, der Monat des Jahres ist kategorial
Datenvisualisierung verstehen

Lass uns üben!

Datenvisualisierung verstehen

Preparing Video For Download...