Welkom bij de course!

Statistische technieken in Tableau

Maarten Van den Broeck

Content Developer at DataCamp

Exploratory Data Analysis (EDA)

  • Belangrijkste kenmerken van je data
  • Extreme waarden opsporen
  • Hypotheses suggereren
  • Aannames toetsen

Algemeen doel: een beeld krijgen van de structuur van je data

Univariate EDA

  • Samenvattingstabel
  • Staafdiagram
  • Histogram
  • Boxplot
Statistische technieken in Tableau

Tabellen en staafdiagrammen

Visualiseer de verdeling van één categorische variabele

Categorie
A
B
A
B
B
C
A
B
C

Een tellingstabel met het aantal voorkomens per categorie

 

Een staafdiagram met het aantal voorkomens per categorie als horizontale balken

Statistische technieken in Tableau

Wanneer tabel vs. plot gebruiken

  • Focus op individuele waarden (momentopname), niet op trends
  • Dataset bevat weinig waarden
  • Kleine verschillen zijn cruciaal
  • Data is niet-interactief gepresenteerd

Een tellingstabel met vier categorieën met extreem lage en hoge waarden.

 

Dezelfde data met extreem lage en hoge waarden, nu als staafdiagram. De extreem lage waarden zijn niet meer zichtbaar.

Statistische technieken in Tableau

Histogrammen

Visualiseer de verdeling van één continue variabele

  • Laagste/hoogste waarde
  • Meest voorkomende waarde(n)
  • Variabele opdelen in bins

Een histogram van aantallen bestelde items per klant, met bin-grootte van één item.

Statistische technieken in Tableau

Grootte van bins

Binwidth = 1.5 Hetzelfde histogram als hiervoor, nu met bin-grootte 1,5; behoudt wat detail van de verdeling.

Binwidth = 4 Hetzelfde histogram als hiervoor, nu met bin-grootte 4; verliest wat detail van de verdeling.

Statistische technieken in Tableau

Modaliteit

Drie histogrammen met uni-, bi- en trimodale verdelingen, met respectievelijk één, twee en drie pieken.

Modus: meest voorkomende waarde

Statistische technieken in Tableau

Laten we oefenen!

Statistische technieken in Tableau

Preparing Video For Download...