Estadísticas con geoms

Visualización de datos intermedia con ggplot2

Rick Scavetta

Founder, Scavetta Academy

ggplot2, curso 2

  • Estadísticas
  • Coordenadas
  • Facetas
  • Buenas prácticas de visualización de datos
Visualización de datos intermedia con ggplot2

Capa de estadísticas

  • Dos categorías de funciones
    • Llamadas desde un geom
    • Llamadas de forma independiente
  • stats_
Visualización de datos intermedia con ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()

geomhistogram

Visualización de datos intermedia con ggplot2

geom_ <-> stat_

p <- ggplot(iris, aes(x = Sepal.Width))
p + geom_histogram()
p + geom_bar()

geomhistogram

Visualización de datos intermedia con ggplot2

geom_ <-> stat_

p <- ggplot(mtcars, aes(x = factor(cyl),  fill = factor(am))) 
p + geom_bar()
p + stat_count()

Visualización de datos intermedia con ggplot2

Relación geom_/stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
Visualización de datos intermedia con ggplot2

stat_smooth()

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth()
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualización de datos intermedia con ggplot2

stat_smooth(se = FALSE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualización de datos intermedia con ggplot2

geom_smooth(span = 0.4)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(se = FALSE, span = 0.4)
geom_smooth() using method = 'loess' and 
formula 'y ~ x'

Visualización de datos intermedia con ggplot2

geom_smooth(method = "lm")

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

Visualización de datos intermedia con ggplot2

geom_smooth(fullrange = TRUE)

ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width, 
                 color = Species)) + 
  geom_point() +
  geom_smooth(method = "lm", 
              fullrange = TRUE)

Visualización de datos intermedia con ggplot2

Relación geom_/stat_

stat_ geom_
stat_bin() geom_histogram(), geom_freqpoly()
stat_count() geom_bar()
stat_smooth() geom_smooth()
Visualización de datos intermedia con ggplot2

Otras funciones stat_

stat_ geom_
stat_boxplot() geom_boxplot()
Visualización de datos intermedia con ggplot2

Otras funciones stat_

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
Visualización de datos intermedia con ggplot2

Otras funciones stat_

stat_ geom_
stat_boxplot() geom_boxplot()
stat_bindot() geom_dotplot()
stat_bin2d() geom_bin2d()
stat_binhex() geom_hex()
stat_contour() geom_contour()
stat_quantile() geom_quantile()
stat_sum() geom_count()
Visualización de datos intermedia con ggplot2

¡Vamos a practicar!

Visualización de datos intermedia con ggplot2

Preparing Video For Download...