Le verbe Summarize

Introduction à Tidyverse

David Robinson

Chief Data Scientist, DataCamp

Transformation et visualisation des données

Introduction à Tidyverse

Extraction de données

gapminder %>%
  filter(country == "United States", year == 2007)
# A tibble: 1 x 6
        country continent  year lifeExp       pop gdpPercap
          <fct>     <fct> <int>   <dbl>     <dbl>     <dbl>
1 United States  Americas  2007  78.242 301139947  42951.65
Introduction à Tidyverse

Le verbe Summarize

gapminder %>%
  summarize(meanLifeExp = mean(lifeExp))
# A tibble: 1 x 1
  meanLifeExp
        <dbl>
1    59.47444
Introduction à Tidyverse

Résumé d'une année

gapminder %>%
  filter(year == 2007) %>%
  summarize(meanLifeExp = mean(lifeExp))
# A tibble: 1 x 1
  meanLifeExp
        <dbl>
1    67.00742
Introduction à Tidyverse

Résumé en plusieurs colonnes

gapminder %>%
  filter(year == 2007) %>%
  summarize(meanLifeExp = mean(lifeExp),
            totalPop = sum(pop))
# A tibble: 1 x 2
  meanLifeExp   totalPop
        <dbl>      <dbl>
1    67.00742 6251013179
Introduction à Tidyverse

Fonctions disponibles pour la synthèse

  • mean
  • sum
  • median
  • min
  • max
Introduction à Tidyverse

Passons à la pratique !

Introduction à Tidyverse

Preparing Video For Download...