Libellés et ordre des facettes

Visualisation de données intermédiaire avec ggplot2

Rick Scavetta

Founder, Scavetta Academy

Nouveau dataframe

# Graphique
p <- ggplot(msleep2, aes(bodywt_log,
                         brainwt_log)) +
  geom_point(alpha = 0.6, shape = 16) +
  coord_fixed()

p

Visualisation de données intermédiaire avec ggplot2

Nouveau dataframe, avec facettes

p +
  facet_grid(rows = vars(vore))

Visualisation de données intermédiaire avec ggplot2

Nouveau dataframe, avec facettes

p +
  facet_grid(rows = vars(vore))

Visualisation de données intermédiaire avec ggplot2

Libellés et ordre médiocres

p +
  facet_grid(rows = vars(vore))

Deux problèmes fréquents avec les facettes :

  • Libellés médiocres (peu descriptifs)
  • Ordre incorrect ou inadapté

Visualisation de données intermédiaire avec ggplot2

Libellés et ordre médiocres

p +
  facet_grid(rows = vars(vore))

Solutions :

  • Simple : ajouter des libellés dans ggplot
  • Mieux : renommer et réordonner les facteurs dans votre dataframe

Visualisation de données intermédiaire avec ggplot2

L’argument labeller

# Par défaut : libeller la valeur
p +
  facet_grid(rows = vars(vore), 
             labeller = label_value)

Visualisation de données intermédiaire avec ggplot2

label_both ajoute le nom de variable

# Afficher aussi le nom de la variable
p +
  facet_grid(rows = vars(vore), 
               labeller = label_both)

Visualisation de données intermédiaire avec ggplot2

Deux variables d’un côté

p +
  facet_grid(rows = vars(vore, 
                         conservation))

Visualisation de données intermédiaire avec ggplot2

label_context évite l’ambiguïté

p +
  facet_grid(rows = vars(vore,
                         conservation),
               labeller = label_context)

Visualisation de données intermédiaire avec ggplot2

Utiliser lignes et colonnes si pertinent

p +
  facet_grid(rows = vars(vore), 
             cols = vars(conservation),
             labeller = label_context)

Visualisation de données intermédiaire avec ggplot2

Utiliser lignes et colonnes si pertinent

p +
  facet_grid(rows = vars(vore), 
             cols = vars(conservation))

Visualisation de données intermédiaire avec ggplot2

Utiliser lignes et colonnes si pertinent

Visualisation de données intermédiaire avec ggplot2

Renommer et réordonner les facteurs

msleep2$conservation <- fct_recode(msleep2$conservation,
                                   Domesticated = "domesticated",
                                   `Least concern` = "lc",
                                   `Near threatened` = "nt",
                                   Vulnerable = "vu",
                                   Endangered = "en")

msleep2$vore = fct_recode(msleep2$vore,
                          Carnivore = "carni",
                          Herbivore = "herbi",
                          Insectivore = "insecti",
                          Omnivore = "omni")
Visualisation de données intermédiaire avec ggplot2

Réinitialiser le graphique avec de nouveaux libellés

# Graphique
p <- ggplot(msleep2, aes(bodywt_log,
                         brainwt_log)) +
  geom_point(alpha = 0.6, shape = 16) +
  coord_fixed()

p +
  facet_grid(rows = vars(vore), 
             cols = vars(conservation)) 

Visualisation de données intermédiaire avec ggplot2

Réinitialiser le graphique avec de nouveaux libellés

Visualisation de données intermédiaire avec ggplot2

Modifier l’ordre des modalités

# Modifier l’ordre des modalités :
msleep2$conservation = fct_relevel(msleep2$conservation,
                                   c("Domesticated",
                                     "Least concern",
                                     "Near threatened",
                                     "Vulnerable",
                                     "Endangered"))

Visualisation de données intermédiaire avec ggplot2

Réinitialiser le graphique avec le nouvel ordre

Visualisation de données intermédiaire avec ggplot2

Passons à la pratique !

Visualisation de données intermédiaire avec ggplot2

Preparing Video For Download...