Statistiken: sum und quantile

Fortgeschrittene Datenvisualisierung mit ggplot2

Rick Scavetta

Founder, Scavetta Academy

Rückblick aus Kurs 1

Ursache von Überlagerung Lösungen
1. Große Datensätze Alpha-Blending, hohle Kreise, Punktgröße
2. Gleiche Werte auf einer Achse Wie oben, plus Position ändern
3. Niedrige Präzision Position: jitter
4. Ganzzahldaten Position: jitter
Fortgeschrittene Datenvisualisierung mit ggplot2

Zählungen plotten gegen Überlagerung

Ursache von Überlagerung Lösungen Hier...
1. Große Datensätze Alpha-Blending, hohle Kreise, Punktgröße
2. Gleiche Werte auf einer Achse Wie oben, plus Position ändern
3. Niedrige Präzision Position: jitter geom_count()
4. Ganzzahldaten Position: jitter geom_count()
Fortgeschrittene Datenvisualisierung mit ggplot2

Niedrige Präzision (& Ganzzahlen)

p <- ggplot(iris, aes(Sepal.Length, 
                      Sepal.Width))

p + geom_point()

Fortgeschrittene Datenvisualisierung mit ggplot2

Jitter kann falsche Eindrücke erzeugen

p + geom_jitter(alpha = 0.5,
                width = 0.1,
                height = 0.1)

Fortgeschrittene Datenvisualisierung mit ggplot2

geom_count()

p + 
  geom_count()

Fortgeschrittene Datenvisualisierung mit ggplot2

Die Verbindung zwischen geom/stat

geom_ stat_
geom_count() stat_sum()
Fortgeschrittene Datenvisualisierung mit ggplot2

stat_sum()

p + 
  stat_sum()

Fortgeschrittene Datenvisualisierung mit ggplot2

Überlagerung kann trotzdem ein Problem sein!

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)

Fortgeschrittene Datenvisualisierung mit ggplot2

geom_quantile()

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)
Fortgeschrittene Datenvisualisierung mit ggplot2

Umgang mit Heteroskedastizität

library(AER)
data(Journals)

p <- ggplot(Journals, 
            aes(log(price/citations), 
                log(subs))) +
  geom_point(alpha = 0.5) +
  labs(...)

p

Fortgeschrittene Datenvisualisierung mit ggplot2

geom_quantile verwenden

p +
  geom_quantile(quantiles = 
                c(0.05, 0.50, 0.95))

Fortgeschrittene Datenvisualisierung mit ggplot2

Die Verbindung zwischen geom/stat

geom_ stat_
geom_count() stat_sum()
geom_quantile() stat_quantile()
Fortgeschrittene Datenvisualisierung mit ggplot2

Bereit für Übungen!

Fortgeschrittene Datenvisualisierung mit ggplot2

Preparing Video For Download...