Patronen verkennen

Je datavisualisaties verbeteren in Python

Nick Strayer

Instructor

Dieper duiken

  • Correlaties onderzoeken
  • Worden correlaties gedreven door confounding?
  • Iets verrassends?

Een schep die in de grond graaft

Je datavisualisaties verbeteren in Python

Doelgroepen

  • Delen met peers
  • Maak slimme ontwerpskeuzes
  • Onthoud: zij kennen de data minder goed

Een cartoonfiguur die een algemene presentatie geeft aan peers

Je datavisualisaties verbeteren in Python
sns.regplot('NO2', 'CO', ci=False, data=pollution,

# Lower opacity of points scatter_kws={'alpha':0.2, 'color':'grey'} )

Spreidingsdiagram van NO2 en CO met een eenvoudige regressielijn eroverheen

Je datavisualisaties verbeteren in Python

Patronen profileren

  • Interessant patroon gevonden
  • Hoe het snel verkennen en uitleggen?
  • Gebruik tekst!

Twee afzonderlijke clusters punten in een spreidingsdiagram zonder labels

Je datavisualisaties verbeteren in Python

Outliers vinden met tekst-scatters

Spreidingsdiagram zonder labels van Denvers gemiddelde SO2- en CO-waarden met een duidelijke uitschieter rechtsboven

Spreidingsdiagram met labels van Denvers gemiddelde SO2- en CO-waarden met duidelijke uitschieter rechtsboven, gelabeld als januari

Je datavisualisaties verbeteren in Python
g = sns.scatterplot("SO2","CO", data=long_beach_avgs)

# Iterate over the rows of our data
for _, row in long_beach_avgs.iterrows():
    # Unpack columns from row
    month, SO2, CO = row

# Draw annotation in correct place g.annotate(month, (SO2,CO))
plt.title('Long Beach avg SO2 by CO')
Je datavisualisaties verbeteren in Python

Spreidingsdiagram met labels van Long Beach’ gemiddelde SO2 en CO per maand

Je datavisualisaties verbeteren in Python

Aan de slag

Je datavisualisaties verbeteren in Python

Preparing Video For Download...