Stats avec les geoms

Visualisation de données intermédiaire avec ggplot2

Rick Scavetta

Founder, Scavetta Academy

ggplot2, cours 2

  • Statistiques
  • Coordonnées
  • Facettes
  • Bonnes pratiques de visualisation
Visualisation de données intermédiaire avec ggplot2

Couche des statistiques

  • Deux catégories de fonctions
    • Appelées dans un geom
    • Appelées seules
  • stats_
Visualisation de données intermédiaire avec ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()

geomhistogram

Visualisation de données intermédiaire avec ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()
p + geom_bar()

geomhistogram

Visualisation de données intermédiaire avec ggplot2

geom_ <-> stat_

p <- ggplot(mtcars, aes(x = factor(cyl),  fill = factor(am))) 
p + geom_bar()
p + stat_count()

Visualisation de données intermédiaire avec ggplot2

Lien entre geom_ et stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
Visualisation de données intermédiaire avec ggplot2

stat_smooth()

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth()
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualisation de données intermédiaire avec ggplot2

stat_smooth(se = FALSE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualisation de données intermédiaire avec ggplot2

geom_smooth(span = 0.4)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE, span = 0.4)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualisation de données intermédiaire avec ggplot2

geom_smooth(method = "lm")

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

Visualisation de données intermédiaire avec ggplot2

geom_smooth(fullrange = TRUE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", 
              fullrange = TRUE)

Visualisation de données intermédiaire avec ggplot2

Lien entre geom_ et stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
stat_smooth() geom_smooth()
Visualisation de données intermédiaire avec ggplot2

Autres fonctions stat_

stat_ geom_
stat_boxplot() geom_boxplot()
Visualisation de données intermédiaire avec ggplot2

Autres fonctions stat_

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
Visualisation de données intermédiaire avec ggplot2

Autres fonctions stat_

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
stat_contour() geom_contour()
stat_quantile() geom_quantile()
stat_sum() geom_count()
Visualisation de données intermédiaire avec ggplot2

Passons à la pratique !

Visualisation de données intermédiaire avec ggplot2

Preparing Video For Download...