Esplorare i pattern

Migliorare le tue visualizzazioni dei dati in Python

Nick Strayer

Instructor

Andare più a fondo

  • Indagare le correlazioni
  • Le correlazioni sono dovute a confondenti?
  • C'è qualcosa di sorprendente?

Una pala che scava nel terreno

Migliorare le tue visualizzazioni dei dati in Python

Pubblico di destinazione

  • Condiviso con i colleghi
  • Prendi decisioni di design intelligenti
  • Ricorda che conoscono meno i dati

Una figura cartoon che presenta ai colleghi

Migliorare le tue visualizzazioni dei dati in Python
sns.regplot('NO2', 'CO', ci=False, data=pollution,

# Lower opacity of points scatter_kws={'alpha':0.2, 'color':'grey'} )

Scatter plot di NO2 e CO con una linea di best fit di base

Migliorare le tue visualizzazioni dei dati in Python

Profilare i pattern

  • Pattern interessante nei dati
  • Come esplorarlo e spiegarlo velocemente?
  • Usa il testo!

Due cluster distinti di punti in uno scatterplot senza etichette

Migliorare le tue visualizzazioni dei dati in Python

Usare scatter testuali per trovare outlier

Scatter plot senza etichette dei valori medi di SO2 e CO di Denver con evidente outlier in alto a destra

Scatter plot etichettato dei valori medi di SO2 e CO di Denver con evidente outlier in alto a destra, identificato come gennaio

Migliorare le tue visualizzazioni dei dati in Python
g = sns.scatterplot("SO2","CO", data=long_beach_avgs)

# Iterate over the rows of our data
for _, row in long_beach_avgs.iterrows():
    # Unpack columns from row
    month, SO2, CO = row

# Draw annotation in correct place g.annotate(month, (SO2,CO))
plt.title('Long Beach avg SO2 by CO')
Migliorare le tue visualizzazioni dei dati in Python

Scatter plot etichettato di SO2 e CO medi di Long Beach per i mesi dell'anno

Migliorare le tue visualizzazioni dei dati in Python

Approfondiamo

Migliorare le tue visualizzazioni dei dati in Python

Preparing Video For Download...