Samenvattingsstatistieken per categorie met seaborn

Financiële data importeren en beheren in Python

Stefan Jansen

Instructor

Categorische plots met seaborn

  • Gespecialiseerde manieren om categorische en numerieke variabelen samen te plotten
  • Schattingen van samenvattingsstatistieken per categorie visualiseren
  • Begrijpen hoe categorieën numerieke variabelen beïnvloeden
  • Vergelijken met kernmaten van distributiekenmerken
  • Voorbeeld: Gem. marktkap per sector of IPO-jaar met spreiding
Financiële data importeren en beheren in Python

De basis: countplot

sns.countplot(x='Sector', data=nasdaq)
plt.xticks(rotation=45)

countplot.png

Financiële data importeren en beheren in Python

countplot, gesorteerd

sector_size = nasdaq.groupby('Sector').size()
order = sector_size.sort_values(ascending=False)
order.head()
Sector
Health Care          645
Finance              627
Technology           433
...
order = order.index.tolist()
['Health Care', 'Finance', ..., 'Energy', 'Transportation']
Financiële data importeren en beheren in Python

countplot, gesorteerd

sns.countplot(x='Sector', data=nasdaq, order=order)
plt.xticks(rotation=45)
plt.title('# Observations per Sector’)

countplot_sorted.png

Financiële data importeren en beheren in Python

countplot, meerdere categorieën

recent_ipos = nasdaq[nasdaq['IPO Year'] > 2014]
recent_ipos['IPO Year'] = recent_ipos['IPO Year'].astype(int)
sns.countplot(x='Sector', hue='IPO Year', data=recent_ipos)

countplot_mc.png

Financiële data importeren en beheren in Python

Statistieken vergelijken met PointPlot

nasdaq['IPO'] = nasdaq['IPO Year'].apply(lambda x: 'After 2000' if x > 2000 else 'Before 2000')
sns.pointplot(x='Sector', y='market_cap_m', hue='IPO', data=nasdaq)
plt.xticks(rotation=45); plt.title('Mean Market Cap')

pointplot.png

Financiële data importeren en beheren in Python

Laten we oefenen!

Financiële data importeren en beheren in Python

Preparing Video For Download...