Estadísticas: sum y quantile

Visualización de datos intermedia con ggplot2

Rick Scavetta

Founder, Scavetta Academy

Recuerda del curso 1

Causa del sobretrazado Soluciones
1. Conjuntos de datos grandes Mezcla alfa, círculos huecos, tamaño del punto
2. Valores alineados en un solo eje Como arriba, y cambiar posición
3. Datos de baja precisión Posición: jitter
4. Datos enteros Posición: jitter
Visualización de datos intermedia con ggplot2

Cuenta puntos para evitar sobretrazado

Causa del sobretrazado Soluciones Aquí...
1. Conjuntos de datos grandes Mezcla alfa, círculos huecos, tamaño del punto
2. Valores alineados en un solo eje Como arriba, y cambiar posición
3. Datos de baja precisión Posición: jitter geom_count()
4. Datos enteros Posición: jitter geom_count()
Visualización de datos intermedia con ggplot2

Datos de baja precisión (y enteros)

p <- ggplot(iris, aes(Sepal.Length, 
                      Sepal.Width))

p + geom_point()

Visualización de datos intermedia con ggplot2

El jitter puede dar una impresión errónea

p + geom_jitter(alpha = 0.5,
                width = 0.1,
                height = 0.1)

Visualización de datos intermedia con ggplot2

geom_count()

p + 
  geom_count()

Visualización de datos intermedia con ggplot2

Conexión geom/stat

geom_ stat_
geom_count() stat_sum()
Visualización de datos intermedia con ggplot2

stat_sum()

p + 
  stat_sum()

Visualización de datos intermedia con ggplot2

El sobretrazado aún puede ser un problema

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)

Visualización de datos intermedia con ggplot2

geom_quantile()

ggplot(iris, aes(Sepal.Length,
                 Sepal.Width, 
                 color = Species)) + 
  geom_count(alpha = 0.4)
Visualización de datos intermedia con ggplot2

Cómo tratar la heterocedasticidad

library(AER)
data(Journals)

p <- ggplot(Journals, 
            aes(log(price/citations), 
                log(subs))) +
  geom_point(alpha = 0.5) +
  labs(...)

p

Visualización de datos intermedia con ggplot2

Usar geom_quantile

p +
  geom_quantile(quantiles = 
                c(0.05, 0.50, 0.95))

Visualización de datos intermedia con ggplot2

Conexión geom/stat

geom_ stat_
geom_count() stat_sum()
geom_quantile() stat_quantile()
Visualización de datos intermedia con ggplot2

¡Listo para practicar!

Visualización de datos intermedia con ggplot2

Preparing Video For Download...