Histogramme

Einführung in die Datenvisualisierung mit ggplot2

Rick Scavetta

Founder, Scavetta Academy

Gängige Diagrammtypen

Diagrammtyp Mögliche Geome
Streudiagramme points, jitter, abline, smooth, count
Balkendiagramme histogram, bar, col, errorbar
Liniendiagramme line, path
Einführung in die Datenvisualisierung mit ggplot2

Histogramme

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram()
  • Ein Diagramm mit gruppierten Werten
    • d. h. eine statistische Funktion
`stat_bin()` using `bins = 30`.
Pick better value with `binwidth`.

Einführung in die Datenvisualisierung mit ggplot2

Standard von 30 geraden Bins

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram()
  • Ein Diagramm mit gruppierten Werten
    • d. h. eine statistische Funktion
# Default bin width:
diff(range(iris$Sepal.Width))/30
[1] 0.08

Einführung in die Datenvisualisierung mit ggplot2

Intuitive und sinnvolle Bin-Breiten

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram(binwidth = 0.1)
  • Lege immer eine sinnvolle Bin-Breite für deine Daten fest.

  • Keine Leerräume zwischen den Balken.

Einführung in die Datenvisualisierung mit ggplot2

Teilstriche neu positionieren

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram(binwidth = 0.1,
                 center = 0.05)
  • Lege immer eine sinnvolle Bin-Breite für deine Daten fest.

  • Keine Leerräume zwischen den Balken.

  • Die Beschriftungen der X-Achse befinden sich zwischen den Balken.

Einführung in die Datenvisualisierung mit ggplot2

Verschiedene Arten

ggplot(iris, aes(x = Sepal.Width, 
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05)

Einführung in die Datenvisualisierung mit ggplot2

Die Standardposition ist "stack".

ggplot(iris, aes(x = Sepal.Width,
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05,
                 position = "stack") 

Einführung in die Datenvisualisierung mit ggplot2

position = "dodge"

ggplot(iris, aes(x = Sepal.Width, 
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05, 
                 position = "dodge")

Einführung in die Datenvisualisierung mit ggplot2

position = "fill"

ggplot(iris, aes(x = Sepal.Width, 
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05, 
                 position = "fill")  

Einführung in die Datenvisualisierung mit ggplot2

Letzte Folie

Einführung in die Datenvisualisierung mit ggplot2

Preparing Video For Download...