Kijken naar de boerenmarktdata

Je datavisualisaties verbeteren in Python

Nick Strayer

Instructor

Eerste verkenning van een dataset

  • Neem een brede blik
  • Toon zoveel mogelijk info
  • Maak je niet druk om uiterlijk

Een doos die opengaat

Je datavisualisaties verbeteren in Python

Je head() gebruiken

pollution.head()

Basisoutput van de Python-functie head met kolomtypen aangegeven

Je datavisualisaties verbeteren in Python
# Alleen de mediaan tonen
pollution.describe(percentiles=[0.5]
                   # Beschrijf alle kolommen
                   include='all')

Output van Panda's describe-functie met categorische data boven en continue data onder samengevat

Je datavisualisaties verbeteren in Python
pd.plotting.scatter_matrix(pollution, alpha = 0.2);

Dichte spreidingsmatrix van vervuilingsdata met correlaties tussen continue kolommen

Je datavisualisaties verbeteren in Python

Spreidingsmatrix van vervuilingsdata met scatter van CO en NO2 gemarkeerd

Je datavisualisaties verbeteren in Python

Spreidingsmatrix van vervuilingsdata met marginale histogrammen op de diagonaal gemarkeerd

Je datavisualisaties verbeteren in Python
markets.head()

Eerste vijf rijen van nieuwe boerenmarktdata met kolomtypen aangegeven

Je datavisualisaties verbeteren in Python

Laten we onze data verkennen

Je datavisualisaties verbeteren in Python

Preparing Video For Download...