Misure di dispersione

Tecniche statistiche in Tableau

Maarten Van den Broeck

Content Developer at DataCamp

Statistiche per descrivere una variabile

Statistica Descrizione
Count numero di osservazioni
Median valore centrale delle osservazioni
Average valore medio delle osservazioni
Min/Max valore minimo e massimo
Quartile/IQR 25º e 75º percentile / ampiezza del 50% più centrale
Modality/Mode numero di modi / valore più frequente
Skewness (a)simmetria della distribuzione
Kurtosis presenza di valori estremi
Tecniche statistiche in Tableau

Misure di dispersione

Due istogrammi normali con varianze diverse

  • La dispersione è influenzata da curtosi (outlier) e asimmetria (skewness)
  • In genere, la dispersione attorno alla media è utile solo per distribuzioni normali
Tecniche statistiche in Tableau

Varianza

$x_{i} - \overline{x}$

$(x_{i} - \overline{x})^2$

$\sum(x_{i} - \overline{x})^2$

$\frac{\sum(x_{i} - \overline{x})^2}{n - 1}$

  • La varianza è la media degli scarti quadratici dalla media
  • Varianza più alta = maggiore dispersione dei dati
  • L'unità della varianza è al quadrato

$x_i$ = singola osservazione, $\overline{x}$ = media del campione

 

 

$n$ = numero di osservazioni

1 Nota: non serve memorizzare le formule. Svelano la “scatola nera” dei calcoli di Tableau.
Tecniche statistiche in Tableau

Deviazione standard (SD o $s$)

$s = \sqrt{\frac{\sum(x_{i} - \overline{x})^2}{n - 1}}$ oppure $s = \sqrt{variance}$

  • L'unità della deviazione standard è la stessa della variabile
  • In media, quanto distano i dati dalla media
  • Il 68% delle osservazioni cade nell'intervallo $[-1s, 1s]$ se i dati sono normali
  • Il numero di deviazioni standard può fare da soglia per individuare valori insoliti

Una distribuzione normale con diversi livelli di deviazione standard.

Tecniche statistiche in Tableau

Popolazione vs. campione

Rappresentazione di un lago d'acqua dolce con la distribuzione delle specie. Tutte le specie sono considerate la popolazione.

Tecniche statistiche in Tableau

Popolazione vs. campione

Prendere un sottoinsieme da una popolazione si chiama campionamento.

Tecniche statistiche in Tableau

Popolazione vs. campione

Inferenza: il processo di trarre conclusioni sulla popolazione dal campione.

Tecniche statistiche in Tableau

Calcolare la dispersione: campione vs popolazione

Varianza di campione $s^2$  

$s^2 = \frac{\sum(x_{i} - \overline{x})^2}{n - 1}$

dati per paese (campione)                     generalizzare all'Europa (popolazione)

Deviazione standard di campione $s$  

$s = \sqrt{\frac{\sum(x_{i} - \overline{x})^2}{n - 1}}$    $\overline{x}$ = media del campione

          $n$ = dimensione del campione

Varianza di popolazione $\sigma$

$\sigma^2 = \frac{\sum(x_{i} - \mu)^2}{N}$

dati della tua università (popolazione)                 nessuna necessità di generalizzare

Deviazione standard di popolazione $\sigma^2$

$\sigma = \sqrt{\frac{\sum(x_{i} - \mu)^2}{N}}$    $\mu$ = media della popolazione

          $N$ = dimensione della popolazione

1 Nota: non serve memorizzare le formule. Svelano la “scatola nera” dei calcoli di Tableau.
Tecniche statistiche in Tableau

Calcolare la dispersione: campione vs popolazione

Varianza di campione $s^2$  

$s^2 = \frac{\sum(x_{i} - \overline{x})^2}{\textbf{n - 1}}$

dati per paese (campione)                     generalizzare all'Europa (popolazione)

Deviazione standard di campione $s$  

$s = \sqrt{\frac{\sum(x_{i} - \overline{x})^2}{\textbf{n - 1}}}$    $\overline{x}$ = media del campione

          $n$ = dimensione del campione

Varianza di popolazione $\sigma^2$  

$\sigma^2 = \frac{\sum(x_{i} - \mu)^2}{\textbf{N}}$

dati della tua università (popolazione)                 nessuna necessità di generalizzare

Deviazione standard di popolazione $\sigma$  

$\sigma = \sqrt{\frac{\sum(x_{i} - \mu)^2}{\textbf{N}}}$    $\mu$ = media della popolazione

          $N$ = dimensione della popolazione

1 Nota: non serve memorizzare le formule. Svelano la “scatola nera” dei calcoli di Tableau.
Tecniche statistiche in Tableau

Lass uns üben!

Tecniche statistiche in Tableau

Preparing Video For Download...