Stats met geoms

Gevorderde datavisualisatie met ggplot2

Rick Scavetta

Founder, Scavetta Academy

ggplot2, cursus 2

  • Statistics
  • Coördinaten
  • Facets
  • Best practices voor datavisualisatie
Gevorderde datavisualisatie met ggplot2

Statistiek-laag

  • Twee categorien functies
    • Aangeroepen binnen een geom
    • Los aangeroepen
  • stats_
Gevorderde datavisualisatie met ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()

geomhistogram

Gevorderde datavisualisatie met ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()
p + geom_bar()

geomhistogram

Gevorderde datavisualisatie met ggplot2

geom_ <-> stat_

p <- ggplot(mtcars, aes(x = factor(cyl),  fill = factor(am))) 
p + geom_bar()
p + stat_count()

Gevorderde datavisualisatie met ggplot2

De link tussen geom_ en stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
Gevorderde datavisualisatie met ggplot2

stat_smooth()

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth()
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Gevorderde datavisualisatie met ggplot2

stat_smooth(se = FALSE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Gevorderde datavisualisatie met ggplot2

geom_smooth(span = 0.4)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE, span = 0.4)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Gevorderde datavisualisatie met ggplot2

geom_smooth(method = "lm")

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

Gevorderde datavisualisatie met ggplot2

geom_smooth(fullrange = TRUE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", 
              fullrange = TRUE)

Gevorderde datavisualisatie met ggplot2

De link tussen geom_ en stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
stat_smooth() geom_smooth()
Gevorderde datavisualisatie met ggplot2

Andere stat_-functies

stat_ geom_
stat_boxplot() geom_boxplot()
Gevorderde datavisualisatie met ggplot2

Andere stat_-functies

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
Gevorderde datavisualisatie met ggplot2

Andere stat_-functies

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
stat_contour() geom_contour()
stat_quantile() geom_quantile()
stat_sum() geom_count()
Gevorderde datavisualisatie met ggplot2

Laten we oefenen!

Gevorderde datavisualisatie met ggplot2

Preparing Video For Download...