Graanopbrengsten visualiseren

Introductie tot functies schrijven in R

Richie Cotton

Data Evangelist at DataCamp

De corn-dataset

glimpse(corn)
Observations: 6,381
Variables: 6
$ year                   <int> 1866, 1866, 1866, 1866, 1866, 1866...
$ state                  <chr> "Alabama", "Arkansas", "California...
$ farmed_area_acres      <dbl> 1050000, 280000, 42000, 57000, 200...
$ yield_bushels_per_acre <dbl> 9.0, 18.0, 28.0, 34.0, 23.0, 9.0, ...
$ farmed_area_ha         <dbl> 424919.92, 113311.98, 16996.80, 23...
$ yield_kg_per_ha        <dbl> 79.29892, 158.59784, 246.70776, 29...
Introductie tot functies schrijven in R

ggplot2: meerdere lijnen tekenen

ggplot(dataset, aes(x, y)) +
  geom_line(aes(group = group))

Een lijngrafiek met meerdere lijnen. De data is verzonnen; het punt is dat de lijnen zijn gegroepeerd via de kolom group in de data frame.

Introductie tot functies schrijven in R

ggplot2: vloeiende trends

ggplot(dataset, aes(x, y)) +
  geom_line(aes(group = group)) +
  geom_smooth()

Dezelfde lijngrafiek als op de vorige slide, maar nu met een extra vloeiende trendlijn. Die lijn is niet gegroepeerd omdat de grouped-esthetic alleen bij geom_line hoort, niet bij de hele plot. Slim, toch?

Introductie tot functies schrijven in R

ggplot2: facetten

ggplot(dataset, aes(x, y)) +
  geom_line(aes(group = group)) +
  geom_smooth() +
  facet_wrap(vars(facet))

Dezelfde plot als net, maar nu in vier panelen met labels ‘A’–‘D’, dankzij facet_wrap.

Introductie tot functies schrijven in R

Censusregio’s van de VS

Het is een statebin-plot: elke Amerikaanse staat is een vierkant, gerangschikt in rijen en kolommen die grofweg de vorm van de VS volgen. Elke censusregio heeft een andere kleur.

Introductie tot functies schrijven in R

dplyr inner joins

dataset1 %>%
  inner_join(dataset2, by = "column_to_join_on")
Introductie tot functies schrijven in R

Laten we oefenen!

Introductie tot functies schrijven in R

Preparing Video For Download...