Spreidingsmaten

Statistische technieken in Tableau

Maarten Van den Broeck

Content Developer at DataCamp

Statistieken om een variabele te beschrijven

Statistiek Beschrijving
Aantal aantal observaties
Mediaan midden van je observaties
Gemiddelde gemiddelde waarde van je observaties
Min/Max laagste en hoogste waarde
Kwartiel/IQR 25e en 75e percentiel / spreiding van de middelste 50%
Modaliteit/Modus aantal modi / meest voorkomende waarde
Scheefheid (a)symmetrie van de verdeling
Kurtosis verdeling van uitschieters
Statistische technieken in Tableau

Spreidingsmaten

Twee normaal verdeelde histogrammen met verschillende varianties

  • Spreiding wordt beïnvloed door kurtosis (uitschieters) en scheefheid (asymmetrie)
  • Spreiding rond het gemiddelde is vooral nuttig bij normale verdelingen
Statistische technieken in Tableau

Variantie

$x_{i} - \overline{x}$

$(x_{i} - \overline{x})^2$

$\sum(x_{i} - \overline{x})^2$

$\frac{\sum(x_{i} - \overline{x})^2}{n - 1}$

  • Variantie is het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde
  • Hogere variantie betekent meer spreiding
  • Eenheid van variantie is in het kwadraat

$x_i$ = individuele datapunt, $\overline{x}$ = steekproefgemiddelde

 

 

$n$ = aantal observaties

1 Opmerking: je hoeft de formules niet te onthouden. Ze laten de black box van Tableau’s berekeningen zien.
Statistische technieken in Tableau

Standaarddeviatie (SD of $s$)

$s = \sqrt{\frac{\sum(x_{i} - \overline{x})^2}{n - 1}}$ of $s = \sqrt{variance}$

  • Eenheid van standaarddeviatie is gelijk aan de variabele
  • Gemiddelde afstand van datapunten tot het gemiddelde
  • 68% van de observaties ligt binnen het bereik $[-1s, 1s]$ bij een normale verdeling
  • Aantal standaarddeviaties kan als drempel voor ongewone waarden dienen

Een normale verdeling met verschillende standaarddeviatieniveaus.

Statistische technieken in Tableau

Populatie vs. steekproef

Weergave van een zoetwatermeer met de soortverdeling. Alle soorten gelden als de populatie.

Statistische technieken in Tableau

Populatie vs. steekproef

Een subset nemen uit een populatie heet steekproeven.

Statistische technieken in Tableau

Populatie vs. steekproef

Inferentie: uitspraken doen over de populatie op basis van de steekproef.

Statistische technieken in Tableau

Spreiding berekenen: steekproef vs. populatie

Steekproefvariantie $s^2$  

$s^2 = \frac{\sum(x_{i} - \overline{x})^2}{n - 1}$

data per land (steekproef)                     generaliseren naar Europa (populatie)

Steekproefstandaarddeviatie $s$  

$s = \sqrt{\frac{\sum(x_{i} - \overline{x})^2}{n - 1}}$    $\overline{x}$ = steekproefgemiddelde

          $n$ = steekproefgrootte

Populatievariantie $\sigma$

$\sigma^2 = \frac{\sum(x_{i} - \mu)^2}{N}$

data van je universiteit (populatie)                 geen generalisatie nodig

Populatiestandaarddeviatie $\sigma^2$

$\sigma = \sqrt{\frac{\sum(x_{i} - \mu)^2}{N}}$    $\mu$ = populatiegemiddelde

          $N$ = populatiegrootte

1 Opmerking: je hoeft de formules niet te onthouden. Ze laten de black box van Tableau’s berekeningen zien.
Statistische technieken in Tableau

Spreiding berekenen: steekproef vs. populatie

Steekproefvariantie $s^2$  

$s^2 = \frac{\sum(x_{i} - \overline{x})^2}{\textbf{n - 1}}$

data per land (steekproef)                     generaliseren naar Europa (populatie)

Steekproefstandaarddeviatie $s$  

$s = \sqrt{\frac{\sum(x_{i} - \overline{x})^2}{\textbf{n - 1}}}$    $\overline{x}$ = steekproefgemiddelde

          $n$ = steekproefgrootte

Populatievariantie $\sigma^2$  

$\sigma^2 = \frac{\sum(x_{i} - \mu)^2}{\textbf{N}}$

data van je universiteit (populatie)                 geen generalisatie nodig

Populatiestandaarddeviatie $\sigma$  

$\sigma = \sqrt{\frac{\sum(x_{i} - \mu)^2}{\textbf{N}}}$    $\mu$ = populatiegemiddelde

          $N$ = populatiegrootte

1 Opmerking: je hoeft de formules niet te onthouden. Ze laten de black box van Tableau’s berekeningen zien.
Statistische technieken in Tableau

Laten we oefenen!

Statistische technieken in Tableau

Preparing Video For Download...