O verbo “summarize”

Introdução ao Tidyverse

David Robinson

Chief Data Scientist, DataCamp

Transformação e visualização de dados

Introdução ao Tidyverse

Extração de dados

gapminder %>%
  filter(country == "United States", year == 2007)
# A tibble: 1 x 6
        country continent  year lifeExp       pop gdpPercap
          <fct>     <fct> <int>   <dbl>     <dbl>     <dbl>
1 United States  Americas  2007  78.242 301139947  42951.65
Introdução ao Tidyverse

O verbo “summarize”

gapminder %>%
  summarize(meanLifeExp = mean(lifeExp))
# A tibble: 1 x 1
  meanLifeExp
        <dbl>
1    59.47444
Introdução ao Tidyverse

Resumir um ano

gapminder %>%
  filter(year == 2007) %>%
  summarize(meanLifeExp = mean(lifeExp))
# A tibble: 1 x 1
  meanLifeExp
        <dbl>
1    67.00742
Introdução ao Tidyverse

Resumir em várias colunas

gapminder %>%
  filter(year == 2007) %>%
  summarize(meanLifeExp = mean(lifeExp),
            totalPop = sum(pop))
# A tibble: 1 x 2
  meanLifeExp   totalPop
        <dbl>      <dbl>
1    67.00742 6251013179
Introdução ao Tidyverse

Funções usadas para resumir

  • mean
  • sum
  • median
  • min
  • max
Introdução ao Tidyverse

Vamos praticar!

Introdução ao Tidyverse

Preparing Video For Download...