Univariate visualisaties

Introductie tot datavisualisatie met Plotly in Python

Alex Scriven

Data Scientist

Wat zijn univariate plots?

  • Univariate plots tonen maar één variabele

 

$$

Veelvoorkomende univariate plots:

  • Staafdiagram
  • Histogram
  • Boxplot
  • Dichtheidsplot
Introductie tot datavisualisatie met Plotly in Python

Histograms

 

Histograms hebben:

  • Meerdere kolommen ("bins") die een waardebereik weergeven
    • Hoogte van elke balk = aantal samples in die bin
  • Aantal bins kan handmatig of automatisch

 

Histogramvoorbeeld

Introductie tot datavisualisatie met Plotly in Python

Onze dataset

De dataset verzameld door wetenschappers over pinguïns:

  • Bevat diverse lichaamsmetingen zoals snavelgrootte, gewicht, enz.
  • Bevat verschillende soorten, geslachten en leeftijden

Pinguïns-dataset

Introductie tot datavisualisatie met Plotly in Python

Histograms met plotly.express

 

fig = px.histogram(
            data_frame=penguins,

x="Body Mass (g)", nbins=10)
fig.show()

Pinguïn-histogram

Introductie tot datavisualisatie met Plotly in Python

Handige histogram-argumenten

 

  • orientation: Plot verticaal (v) of horizontaal (h) oriënteren
  • histfunc: Aggregatie per bin instellen (bijv. gemiddelde, min, max).

$$

$$

$$

$$

Bekijk de documentatie voor meer

Introductie tot datavisualisatie met Plotly in Python

Boxplots (box-whisker)

Vat een variabele samen met kwartielen

$$

  • Middelste gebied is het interkwartielbereik
    • Bovenste lijn = 3e kwartiel (75e percentiel)
    • Middellijn = mediaan (50e percentiel)
    • Onderste lijn = 1e kwartiel (25e percentiel)
  • Boven/onderste staven = min/max, excl. uitschieters

Boxplot pinguïns

  • Punten buiten de snorren zijn uitschieters
Introductie tot datavisualisatie met Plotly in Python

Boxplots met plotly.express

 

$$

fig = px.box(data_frame=penguins, 
            y="Flipper Length (mm)")
fig.show()

Boxplot

Introductie tot datavisualisatie met Plotly in Python

Handige boxplot-argumenten

 

  • hover_data: Lijst met kolomnamen om te tonen bij hover
    • Handig om uitschieters te duiden
  • points: Extra opties voor weergave van uitschieters

$$

$$

$$

$$

Bekijk de documentatie voor meer

Introductie tot datavisualisatie met Plotly in Python

Laten we oefenen!

Introductie tot datavisualisatie met Plotly in Python

Preparing Video For Download...