Alternatieven voor boxplots

Best practices voor visualisaties in R

Nick Strayer

Instructor

Beperkingen van boxplot met jitter

  • Jitter kan beperkt overlap aan
  • Dichtheid is lastig te zien

Best practices voor visualisaties in R

Wat zijn andere opties?

Beeswarmplots

Violinplots

Best practices voor visualisaties in R

Beeswarmplots

  • ‘Slimme’ jitter
  • Individuele punten zo dicht mogelijk tegen de as geclusterd
  • Handig beschikbaar als geom_beeswarm() in het ggbeeswarm-pakket.
library(ggbeeswarm)
ggplot(data, aes(y = y, x =  group)) + 
  geom_beeswarm(color = 'steelblue')
Best practices voor visualisaties in R

Best practices voor visualisaties in R

Beeswarm: pluspunten

  • Individuele datapunten
  • Vorm van de verdeling

Best practices voor visualisaties in R

Beeswarm: minpunten

  • Wordt lastig bij veel data
  • Willekeurige stapeling

Best practices voor visualisaties in R

Violinplots

  • KDE gespiegeld voor symmetrie
  • Vervang geom_boxplot() door geom_violin().
ggplot(data, aes(y = y, x = group)) + 
  geom_violin(fill = 'steelblue') 
Best practices voor visualisaties in R

Best practices voor visualisaties in R

Violin: pluspunten

  • Elk datapunt telt mee
  • Niet elk punt is zichtbaar: goed bij veel data

Best practices voor visualisaties in R

Violin: minpunten

  • Keuze van kernelbreedte
  • Niet elk punt is zichtbaar

Best practices voor visualisaties in R

Laten we wat geavanceerdere vergelijkingen proberen!

Best practices voor visualisaties in R

Preparing Video For Download...