Un grafico vale più di mille parole

Comprendere la Data Visualization

Richie Cotton

Data Evangelist at DataCamp

Cosa imparerai

  • Come si sceglie un grafico appropriato?
  • Come si interpretano i tipi di grafici più comuni?
  • Quali sono le best practice per disegnare grafici?
Comprendere la Data Visualization

Tre modi per ottenere informazioni

media, mediana, deviazione standard

Modelli in esecuzione

regressione lineare e logistica

Disegnare grafici

a dispersione, a barra, istogrammi

Comprendere la Data Visualization

La dozzina di Datasaurus

away_x away_y bullseye_x bullseye_y ... x_shape_x x_shape_y
32.33 61.41 51.20 83.34 ... 38.34 92.47
53.42 26.19 58.97 85.50 ... 35.75 94.12
63.92 30.83 51.87 85.83 ... 32.77 88.52
70.29 82.53 48.18 85.05 ... 33.73 88.62
34.12 45.73 41.68 84.02 ... 37.24 83.72
67.67 37.11 37.89 82.57 ... 36.03 82.04
1 Matejka, J., & Fitzmaurice, G. (2017) https://www.autodeskresearch.com/publications/samestats
Comprendere la Data Visualization

Media di x per ogni set di dati

set di dati media(x)
away 54.27
bullseye 54.27
circle 54.27
dino 54.26
dots 54.26
h_lines 54.26
high_lines 54.27
set di dati media(x)
slant_down 54.27
slant_up 54.27
star 54.27
v_lines 54.27
wide_lines 54.27
x_shape 54.26
Comprendere la Data Visualization

Media di x e y per ogni set di dati

set di dati media(x) media(y)
away 54.27 47.83
bullseye 54.27 47.83
circle 54.27 47.84
dino 54.26 47.83
dots 54.26 47.84
h_lines 54.26 47.83
high_lines 54.27 47.84
set di dati media(x) media(y)
slant_down 54.27 47.84
slant_up 54.27 47.83
star 54.27 47.84
v_lines 54.27 47.84
wide_lines 54.27 47.83
x_shape 54.26 47.84
Comprendere la Data Visualization

Deviazioni standard per ogni set di dati

set di dati std_dev(x) std_dev(y)
away 16.77 26.94
bullseye 16.77 26.94
circle 16.76 26.93
dino 16.77 26.94
dots 16.77 26.93
h_lines 16.77 26.94
high_lines 16.77 26.94
set di dati std_dev(x) std_dev(y)
slant_down 16.77 26.94
slant_up 16.77 26.94
star 16.77 26.93
v_lines 16.77 26.94
wide_lines 16.77 26.94
x_shape 16.77 26.93
Comprendere la Data Visualization

Grafici a dispersione dei 13 set di dati della dozzina di Datasaurus. Ogni set di dati appare molto diverso dagli altri.

Comprendere la Data Visualization

Variabili continue e categoriche

Continue: di solito numeri

  • altezze, temperature, ricavi
Comprendere la Data Visualization

Variabili continue e categoriche

Continue: di solito numeri

  • altezze, temperature, ricavi

Categoriche: di solito testo

  • colori degli occhi, Paesi, settore
Comprendere la Data Visualization

Variabili continue e categoriche

Continue: di solito numeri

  • altezze, temperature, ricavi

Categoriche: di solito testo

  • colori degli occhi, Paesi, settore

Può essere che

  • l'età sia continua, ma il gruppo di età sia categorico.
  • il tempo sia continuo, ma il mese dell'anno sia categorico.
Comprendere la Data Visualization

Passiamo alla pratica!

Comprendere la Data Visualization

Preparing Video For Download...