Analisi dei dati del farmers market

Migliorare le tue visualizzazioni dei dati in Python

Nick Strayer

Instructor

Prime esplorazioni di un dataset

  • Vista d'insieme
  • Mostra più info possibile
  • Non curarti dell'estetica

Una scatola che si apre

Migliorare le tue visualizzazioni dei dati in Python

Usare head()

pollution.head()

Output base di head in Python con i tipi di colonna indicati

Migliorare le tue visualizzazioni dei dati in Python
# Just show median
pollution.describe(percentiles=[0.5]
                   # Describe all columns
                   include='all')

Output di describe di Pandas con dati categoriali in alto e continui in basso

Migliorare le tue visualizzazioni dei dati in Python
pd.plotting.scatter_matrix(pollution, alpha = 0.2);

Matrice a dispersione densa dei dati sull'inquinamento che mostra correlazioni tra colonne continue

Migliorare le tue visualizzazioni dei dati in Python

Matrice a dispersione dei dati sull'inquinamento con CO e NO2 evidenziati

Migliorare le tue visualizzazioni dei dati in Python

Matrice a dispersione dei dati sull'inquinamento con istogrammi marginali in diagonale evidenziati

Migliorare le tue visualizzazioni dei dati in Python
markets.head()

Prime cinque righe dei nuovi dati del farmers market con i tipi di colonna indicati

Migliorare le tue visualizzazioni dei dati in Python

Esploriamo i dati

Migliorare le tue visualizzazioni dei dati in Python

Preparing Video For Download...