Diagramas de dispersión

Introducción a la visualización de datos con ggplot2

Rick Scavetta

Founder, Scavetta Academy

48 geometrías

geom_*
abline contour dotplot jitter pointrange ribbon spoke
area count errorbar label polygon rug step
bar crossbar errorbarh line qq segment text
bin2d curve freqpoly linerange qq_line sf tile
blank density hex map quantile sf_label violin
boxplot density2d histogram path raster sf_text vline
col density_2d hline point rect smooth
Introducción a la visualización de datos con ggplot2

Tipos de gráficos comunes

Tipo de gráfico Geomas posibles
Diagramas de dispersión points, jitter, abline, smooth, count
Introducción a la visualización de datos con ggplot2

Diagramas de dispersión

  • Cada geom puede aceptar asignaciones estéticas específicas, por ejemplo geom_point():
Essential
x,y
ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width)) + 
  geom_point()

Introducción a la visualización de datos con ggplot2

Diagramas de dispersión

  • Cada geom puede aceptar asignaciones estéticas específicas, por ejemplo geom_point():
Essential Opcional
x,y alpha, color, fill, shape, size, stroke
ggplot(iris, aes(x = Sepal.Length, 
                 y = Sepal.Width,
                 col = Species)) + 
  geom_point()

Introducción a la visualización de datos con ggplot2

Asignación estética específica de geom

# These result in the same plot! 
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point()

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width)) + 
  geom_point(aes(col = Species))

Controla los mapeados estéticos de cada capa de forma independiente:

Introducción a la visualización de datos con ggplot2
head(iris, 3) # Raw data
Species Sepal.Length Sepal.Width Petal.Length Petal.Width
1  setosa          5.1         3.5          1.4         0.2
2  setosa          4.9         3.0          1.4         0.2
3  setosa          4.7         3.2          1.3         0.2
iris %>%
  group_by(Species) %>% 
  summarise_all(mean) -> iris.summary

iris.summary # Summary statistics
# A tibble: 3 x 5
  Species    Sepal.Length Sepal.Width Petal.Length Petal.Width
  <fct>             <dbl>       <dbl>        <dbl>       <dbl>
1 setosa             5.01        3.43         1.46       0.246
2 versicolor         5.94        2.77         4.26       1.33 
3 virginica          6.59        2.97         5.55       2.03
Introducción a la visualización de datos con ggplot2
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) +
  # Inherits both data and aes from ggplot() 
  geom_point() + 
  # Different data, but inherited aes
  geom_point(data = iris.summary, shape = 15, size = 5)

Introducción a la visualización de datos con ggplot2

Valores de los atributos de forma

Introducción a la visualización de datos con ggplot2

Ejemplo

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point() +
  geom_point(data = iris.summary, shape = 21, size = 5, 
             fill = "black", stroke = 2)

Introducción a la visualización de datos con ggplot2

Estadísticas sobre la marcha mediante ggplot2

  • Consulta el segundo curso para ver la capa de estadísticas.
  • Nota: Evita generar gráfico solamente de la media sin una medida de dispersión, por ejemplo, la desviación estándar.

Introducción a la visualización de datos con ggplot2

position = "jitter"

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_point(position = "jitter")

Introducción a la visualización de datos con ggplot2

geom_jitter()

Un atajo hacia geom_point(position = "jitter")

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_jitter()

Introducción a la visualización de datos con ggplot2

No olvides ajustar alfa

  • Combina el jittering con el alpha-blending si es necesario
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_jitter(alpha = 0.6)

Introducción a la visualización de datos con ggplot2

Los círculos huecos también ayudan

  • shape = 1 es un. círculo hueco.
  • No es necesario utilizar también la mezcla alfa.
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, col = Species)) + 
  geom_jitter(shape = 1)

Introducción a la visualización de datos con ggplot2

¡Vamos a practicar!

Introducción a la visualización de datos con ggplot2

Preparing Video For Download...