Presentación de los datos

Análisis exploratorio de datos en R

Andrew Bray

Assistant Professor, Reed College

Conjunto de datos de emails

email
# A tibble: 3,921 × 21
       spam to_multiple  from    cc sent_email                time image
     <fct>       <dbl> <dbl> <int>      <dbl>              <dttm> <dbl>
1  not-spam           0     1     0          0 2012-01-01 01:16:41     0
2  not-spam           0     1     0          0 2012-01-01 02:03:59     0
3  not-spam           0     1     0          0 2012-01-01 11:00:32     0
4  not-spam           0     1     0          0 2012-01-01 04:09:49     0
5  not-spam           0     1     0          0 2012-01-01 05:00:01     0
6  not-spam           0     1     0          0 2012-01-01 05:04:46     0
7  not-spam           1     1     0          1 2012-01-01 12:55:06     0
8  not-spam           1     1     1          1 2012-01-01 13:45:21     1
9  not-spam           0     1     0          0 2012-01-01 16:08:59     0
10 not-spam           0     1     0          0 2012-01-01 13:12:00     0
# ... with 3,911 more rows, and 14 more variables: attach <dbl>,
#   dollar <dbl>, winner <fct>, inherit <dbl>, viagra <dbl>,
#   password <dbl>, num_char <dbl>, line_breaks <int>, format <dbl>,
#   re_subj <dbl>, exclaim_subj <dbl>, urgent_subj <dbl>,
#   exclaim_mess <dbl>, number <fct>
Análisis exploratorio de datos en R

Histogramas

ggplot(data, aes(x = var1)) +
  geom_histogram()

Histogramas

Análisis exploratorio de datos en R

Histogramas

ggplot(data, aes(x = var1)) +
  geom_histogram() +
  facet_wrap(~var2)

Histogramas por facetas

Análisis exploratorio de datos en R

Diagramas de caja

ggplot(data, aes(x = var2, y = var1)) +
  geom_boxplot()

Diagramas de caja

Análisis exploratorio de datos en R

Diagramas de caja

ggplot(data, aes(x = 1, y = var1)) +
  geom_boxplot()

Diagrama de caja

Análisis exploratorio de datos en R

Gráficos de densidad

ggplot(data, aes(x = var1)) +
  geom_density()

Gráficos de densidad

Análisis exploratorio de datos en R

Gráficos de densidad

ggplot(data, aes(x = var1, fill = var2)) +
  geom_density(alpha = .3)

Gráficos de densidad por grupo

Análisis exploratorio de datos en R

¡Vamos a practicar!

Análisis exploratorio de datos en R

Preparing Video For Download...