Stats: soma e quantil

Visualização de Dados Intermediária com ggplot2

Rick Scavetta

Founder, Scavetta Academy

Relembrando do curso 1

Causa do overplotting Soluções
1. Conjuntos grandes Alpha blending, círculos vazados, tamanho do ponto
2. Valores alinhados em um eixo Como acima, mais mudar posição
3. Dados de baixa precisão Posição: jitter
4. Dados inteiros Posição: jitter
Visualização de Dados Intermediária com ggplot2

Plote contagens para evitar overplotting

Causa do overplotting Soluções Aqui...
1. Conjuntos grandes Alpha blending, círculos vazados, tamanho do ponto
2. Valores alinhados em um eixo Como acima, mais mudar posição
3. Dados de baixa precisão Posição: jitter geom_count()
4. Dados inteiros Posição: jitter geom_count()
Visualização de Dados Intermediária com ggplot2

Dados de baixa precisão (e inteiros)

p <- ggplot(iris, aes(Sepal.Length, 
                      Sepal.Width))

p + geom_point()

Visualização de Dados Intermediária com ggplot2

Jitter pode dar impressão errada

p + geom_jitter(alpha = 0.5,
                width = 0.1,
                height = 0.1)

Visualização de Dados Intermediária com ggplot2

geom_count()

p + 
  geom_count()

Visualização de Dados Intermediária com ggplot2

Conexão entre geom e stat

geom_ stat_
geom_count() stat_sum()
Visualização de Dados Intermediária com ggplot2

stat_sum()

p + 
  stat_sum()

Visualização de Dados Intermediária com ggplot2

Overplotting ainda pode ser um problema!

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)

Visualização de Dados Intermediária com ggplot2

geom_quantile()

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)
Visualização de Dados Intermediária com ggplot2

Lidando com heterocedasticidade

library(AER)
data(Journals)

p <- ggplot(Journals, 
            aes(log(price/citations), 
                log(subs))) +
  geom_point(alpha = 0.5) +
  labs(...)

p

Visualização de Dados Intermediária com ggplot2

Usando geom_quantiles

p +
  geom_quantile(quantiles = 
                c(0.05, 0.50, 0.95))

Visualização de Dados Intermediária com ggplot2

Conexão entre geom e stat

geom_ stat_
geom_count() stat_sum()
geom_quantile() stat_quantile()
Visualização de Dados Intermediária com ggplot2

Pronto para os exercícios!

Visualização de Dados Intermediária com ggplot2

Preparing Video For Download...