Gráficos de dispersão

Introdução à visualização de dados com ggplot2

Rick Scavetta

Founder, Scavetta Academy

48 geometrias

geom_*
abline contour dotplot jitter pointrange ribbon spoke
area count errorbar label polygon rug step
bar crossbar errorbarh line qq segment text
bin2d curve freqpoly linerange qq_line sf tile
blank density hex map quantile sf_label violin
boxplot density2d histogram path raster sf_text vline
col density_2d hline point rect smooth
Introdução à visualização de dados com ggplot2

Tipos comuns de gráficos

Tipo de gráfico Possíveis geometrias
Gráficos de dispersão pontos, dispersão, referência, suavidade, contagem
Introdução à visualização de dados com ggplot2

Gráficos de dispersão

  • Cada geometria aceita mapeamentos estéticos específicos. Ex.: geom_point():
Essential
x,y
ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width)) + 
  geom_point()

Introdução à visualização de dados com ggplot2

Gráficos de dispersão

  • Cada geometria aceita mapeamentos estéticos específicos. Ex.: geom_point():
Essential Opcional
x,y alfa, cor, preenchimento, forma, tamanho, traço
ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width,
                 col = Species)) + 
  geom_point()

Introdução à visualização de dados com ggplot2

Mapeamentos estéticos específicos da geometria

# These result in the same plot! 
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point()

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width)) + 
  geom_point(aes(col = Species))

Controle os mapeamentos estéticos de cada camada independentemente:

Introdução à visualização de dados com ggplot2
head(iris, 3) # Raw data
Species Sepal.Length Sepal.Width Petal.Length Petal.Width
1  setosa          5.1         3.5          1.4         0.2
2  setosa          4.9         3.0          1.4         0.2
3  setosa          4.7         3.2          1.3         0.2
iris %>%
  group_by(Species) %>% 
  summarise_all(mean) -> iris.summary

iris.summary # Summary statistics
# A tibble: 3 x 5
  Species    Sepal.Length Sepal.Width Petal.Length Petal.Width
  <fct>             <dbl>       <dbl>        <dbl>       <dbl>
1 setosa             5.01        3.43         1.46       0.246
2 versicolor         5.94        2.77         4.26       1.33 
3 virginica          6.59        2.97         5.55       2.03
Introdução à visualização de dados com ggplot2
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) +
  # Inherits both data and aes from ggplot() 
  geom_point() + 
  # Different data, but inherited aes
  geom_point(data = iris.summary, shape = 15, size = 5)

Introdução à visualização de dados com ggplot2

Valores de atributos de forma

Introdução à visualização de dados com ggplot2

Exemplo

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point() +
  geom_point(data = iris.summary, shape = 21, size = 5, 
             fill = "black", stroke = 2)

Introdução à visualização de dados com ggplot2

Estatísticas em tempo real do ggplot2

  • Consulte o segundo curso para ver a camada de estatísticas.
  • Observação: Evite plotar apenas a média sem uma medida de dispersão, por exemplo, o desvio padrão.

Introdução à visualização de dados com ggplot2

position = "jitter"

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point(position = "jitter")

Introdução à visualização de dados com ggplot2

geom_jitter()

Um atalho para geom_point(position = "jitter")

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_jitter()

Introdução à visualização de dados com ggplot2

Não se esqueça de ajustar o alfa

  • Combine jittering com alpha-blending, se necessário
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_jitter(alpha = 0.6)

Introdução à visualização de dados com ggplot2

Círculos ocos também ajudam

  • shape = 1 é um círculo oco.
  • Não é necessário usar também alfa-blending.
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_jitter(shape = 1)

Introdução à visualização de dados com ggplot2

Vamos praticar!

Introdução à visualização de dados com ggplot2

Preparing Video For Download...