Estatísticas com geoms

Visualização de Dados Intermediária com ggplot2

Rick Scavetta

Founder, Scavetta Academy

ggplot2, curso 2

  • Estatísticas
  • Coordenadas
  • Facetas
  • Boas práticas de visualização de dados
Visualização de Dados Intermediária com ggplot2

Camada de estatísticas

  • Duas categorias de funções
    • Chamadas dentro de um geom
    • Chamadas de forma independente
  • stats_
Visualização de Dados Intermediária com ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()

geomhistogram

Visualização de Dados Intermediária com ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()
p + geom_bar()

geomhistogram

Visualização de Dados Intermediária com ggplot2

geom_ <-> stat_

p <- ggplot(mtcars, aes(x = factor(cyl),  fill = factor(am))) 
p + geom_bar()
p + stat_count()

Visualização de Dados Intermediária com ggplot2

A conexão geom_/stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
Visualização de Dados Intermediária com ggplot2

stat_smooth()

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth()
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualização de Dados Intermediária com ggplot2

stat_smooth(se = FALSE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualização de Dados Intermediária com ggplot2

geom_smooth(span = 0.4)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE, span = 0.4)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualização de Dados Intermediária com ggplot2

geom_smooth(method = "lm")

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

Visualização de Dados Intermediária com ggplot2

geom_smooth(fullrange = TRUE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", 
              fullrange = TRUE)

Visualização de Dados Intermediária com ggplot2

A conexão geom_/stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
stat_smooth() geom_smooth()
Visualização de Dados Intermediária com ggplot2

Outras funções stat_

stat_ geom_
stat_boxplot() geom_boxplot()
Visualização de Dados Intermediária com ggplot2

Outras funções stat_

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
Visualização de Dados Intermediária com ggplot2

Outras funções stat_

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
stat_contour() geom_contour()
stat_quantile() geom_quantile()
stat_sum() geom_count()
Visualização de Dados Intermediária com ggplot2

Vamos praticar!

Visualização de Dados Intermediária com ggplot2

Preparing Video For Download...