Bonnes pratiques : diagrammes en barres

Visualisation de données intermédiaire avec ggplot2

Rick Scavetta

Founder, Scavetta Academy

Dans ce chapitre

  • Pièges courants en dataviz
  • Meilleures représentations
    • Pour l’explicatif (communication)
    • Pour l’exploratoire (analyse)
Visualisation de données intermédiaire avec ggplot2

Diagrammes en barres

  • Deux types
    • Valeurs absolues
    • Distributions
Visualisation de données intermédiaire avec ggplot2

Sommeil des mammifères

Observations : 76
Variables : 3
$ vore  <chr> "carni", "omni", "herbi", "omni", "herbi", "herbi", "carni", …
$ total <dbl> 12.1, 17.0, 14.4, 14.9, 4.0, 14.4, 8.7, 10.1, 3.0, 5.3, 9.4, …
$ rem   <dbl> NA, 1.8, 2.4, 2.3, 0.7, 2.2, 1.4, 2.9, NA, 0.6, 0.8, 0.7, 1.5…
Visualisation de données intermédiaire avec ggplot2

Graphique « dynamite »

d <- ggplot(sleep, aes(vore, total)) +
 # ...

d + 
  stat_summary(fun = mean,
               geom = "bar",
               fill = "grey50") +
  stat_summary(fun.data = mean_sdl,
               fun.args = list(mult = 1),
               geom = "errorbar", 
               width = 0.2)

Visualisation de données intermédiaire avec ggplot2

Points de données individuels

# position
posn_j <- position_jitter(width = 0.2)

# plot
d +
  geom_point(alpha = 0.6, 
             position = posn_j)

Visualisation de données intermédiaire avec ggplot2

geom_errorbar()

d +
  geom_point(...) +
  stat_summary(fun = mean, 
               geom = "point", 
               fill = "red") +
  stat_summary(fun.data = mean_sdl, 
               fun.args = list(mult = 1), 
               geom = "errorbar", 
               width = 0.2, 
               color = "red")

Visualisation de données intermédiaire avec ggplot2

geom_pointrange()

d +
  geom_point(...) +
  stat_summary(fun.data = mean_sdl, 
               mult = 1, 
               width = 0.2, 
               color = "red")

Visualisation de données intermédiaire avec ggplot2

Sans points de données

d +
  stat_summary(fun = mean, 
               geom = "point") +
  stat_summary(fun.data = mean_sdl, 
               fun.args = list(mult = 1), 
               geom = "errorbar", 
               width = 0.2)

Visualisation de données intermédiaire avec ggplot2

Les barres ne sont pas nécessaires

Visualisation de données intermédiaire avec ggplot2

Prêt pour les exercices !

Visualisation de données intermédiaire avec ggplot2

Preparing Video For Download...