Distribuição de uma variável

Análise Exploratória de Dados em R

Andrew Bray

Assistant Professor, Reed College

Marginal vs. condicional

ggplot(cars, aes(x = hwy_mpg)) +
  geom_histogram()
`stat_bin()` usando `bins = 30`. Escolha um valor melhor com `binwidth`.
Mensagem de aviso:
14 linhas removidas contendo valores não finitos (stat_bin). 

ch2_2.003.png

Análise Exploratória de Dados em R

Marginal vs. condicional

ggplot(cars, aes(x = hwy_mpg)) +
  geom_histogram() +
  facet_wrap(~pickup)
`stat_bin()` usando `bins = 30`. Escolha um valor melhor com `binwidth`.
Mensagem de aviso:
14 linhas removidas contendo valores não finitos (stat_bin).

ch2_2.006.png

Análise Exploratória de Dados em R

Construindo um pipeline de dados

cars2 <- cars %>%
  filter(eng_size < 2.0)

ggplot(cars2, aes(x = hwy_mpg)) +
  geom_histogram()
Análise Exploratória de Dados em R

Construindo um pipeline de dados

cars %>%
  filter(eng_size < 2.0) %>%
  ggplot(aes(x = hwy_mpg)) +
  geom_histogram()
Análise Exploratória de Dados em R

Histograma filtrado e facetado

cars %>%
  filter(eng_size < 2.0) %>%
  ggplot(aes(x = hwy_mpg)) +
  geom_histogram()
`stat_bin()` usando `bins = 30`. Escolha um valor melhor com `binwidth`.

ch2_2.011.png

Análise Exploratória de Dados em R

Largura de bin ampla

cars %>%
  filter(eng_size < 2.0) %>%
  ggplot(aes(x = hwy_mpg)) +
  geom_histogram(binwidth = 5)

ch2_2.013.png

Análise Exploratória de Dados em R

Gráfico de densidade

cars %>%
  filter(eng_size < 2.0) %>%
  ggplot(aes(x = hwy_mpg)) +
  geom_density()

ch2_2.015.png

Análise Exploratória de Dados em R

Largura de banda ampla

cars %>%   
  filter(eng_size < 2.0) %>%
  ggplot(aes(x = hwy_mpg)) +
  geom_density(bw = 5)

ch2_2.017.png

Análise Exploratória de Dados em R

Vamos praticar!

Análise Exploratória de Dados em R

Preparing Video For Download...