Boas práticas: gráficos de barras

Visualização de Dados Intermediária com ggplot2

Rick Scavetta

Founder, Scavetta Academy

Neste capítulo

  • Armadilhas comuns em visualização de dados
  • Melhor forma de representar dados
    • Para comunicação (explicativa) eficaz, e
    • Para exploração (investigativa) eficaz
Visualização de Dados Intermediária com ggplot2

Gráficos de barras

  • Dois tipos
    • Valores absolutos
    • Distribuições
Visualização de Dados Intermediária com ggplot2

Sono de mamíferos

Observations: 76
Variables: 3
$ vore  <chr> "carni", "omni", "herbi", "omni", "herbi", "herbi", "carni", …
$ total <dbl> 12.1, 17.0, 14.4, 14.9, 4.0, 14.4, 8.7, 10.1, 3.0, 5.3, 9.4, …
$ rem   <dbl> NA, 1.8, 2.4, 2.3, 0.7, 2.2, 1.4, 2.9, NA, 0.6, 0.8, 0.7, 1.5…
Visualização de Dados Intermediária com ggplot2

Gráfico dinamite

d <- ggplot(sleep, aes(vore, total)) +
 # ...

d + 
  stat_summary(fun = mean,
               geom = "bar",
               fill = "grey50") +
  stat_summary(fun.data = mean_sdl,
               fun.args = list(mult = 1),
               geom = "errorbar", 
               width = 0.2)

Visualização de Dados Intermediária com ggplot2

Pontos individuais

# position
posn_j <- position_jitter(width = 0.2)

# plot
d +
  geom_point(alpha = 0.6, 
             position = posn_j)

Visualização de Dados Intermediária com ggplot2

geom_errorbar()

d +
  geom_point(...) +
  stat_summary(fun = mean, 
               geom = "point", 
               fill = "red") +
  stat_summary(fun.data = mean_sdl, 
               fun.args = list(mult = 1), 
               geom = "errorbar", 
               width = 0.2, 
               color = "red")

Visualização de Dados Intermediária com ggplot2

geom_pointrange()

d +
  geom_point(...) +
  stat_summary(fun.data = mean_sdl, 
               mult = 1, 
               width = 0.2, 
               color = "red")

Visualização de Dados Intermediária com ggplot2

Sem pontos de dados

d +
  stat_summary(fun = mean, 
               geom = "point") +
  stat_summary(fun.data = mean_sdl, 
               fun.args = list(mult = 1), 
               geom = "errorbar", 
               width = 0.2)

Visualização de Dados Intermediária com ggplot2

Barras nem sempre são necessárias

Visualização de Dados Intermediária com ggplot2

Vamos praticar!

Visualização de Dados Intermediária com ggplot2

Preparing Video For Download...