Histogramas

Introdução à visualização de dados com ggplot2

Rick Scavetta

Founder, Scavetta Academy

Tipos comuns de gráficos

Tipo de gráfico Possíveis geometrias
Gráficos de dispersão pontos, dispersão, referência, suavidade, contagem
Gráficos de barras histograma, barra, coluna, barra de erros
Gráficos de linhas linha, caminho
Introdução à visualização de dados com ggplot2

Histogramas

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram()
  • Um gráfico de valores em bins
    • ou seja, uma função estatística
`stat_bin()` using `bins = 30`.
Pick better value with `binwidth`.

Introdução à visualização de dados com ggplot2

Padrão de 30 bins uniformes

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram()
  • Um gráfico de valores em bins
    • ou seja, uma função estatística
# Default bin width:
diff(range(iris$Sepal.Width))/30
[1] 0.08

Introdução à visualização de dados com ggplot2

Larguras de bins intuitivas e significativas

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram(binwidth = 0.1)
  • Sempre escolha larguras de bin adequadas para seus dados.

  • Sem espaços entre as barras.

Introdução à visualização de dados com ggplot2

Reposicionar marcas de escala

ggplot(iris, aes(x = Sepal.Width)) + 
  geom_histogram(binwidth = 0.1,
                 center = 0.05)
  • Sempre escolha larguras de bin adequadas para seus dados.

  • Sem espaços entre as barras.

  • Os rótulos do eixo X estão entre as barras.

Introdução à visualização de dados com ggplot2

Espécies diferentes

ggplot(iris, aes(x = Sepal.Width, 
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05)

Introdução à visualização de dados com ggplot2

A posição padrão é "stack"

ggplot(iris, aes(x = Sepal.Width,
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05,
                 position = "stack") 

Introdução à visualização de dados com ggplot2

position = "dodge"

ggplot(iris, aes(x = Sepal.Width, 
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05, 
                 position = "dodge")

Introdução à visualização de dados com ggplot2

position = "fill"

ggplot(iris, aes(x = Sepal.Width, 
                 fill = Species)) + 
  geom_histogram(binwidth = .1, 
                 center = 0.05, 
                 position = "fill")  

Introdução à visualização de dados com ggplot2

Slide final

Introdução à visualização de dados com ggplot2

Preparing Video For Download...