Relaties tussen tijdreeksen: correlatie

Tijdreeksgegevens manipuleren in Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Correlatie & relaties tussen reeksen

  • Tot nu toe: focus op kenmerken van losse variabelen
  • Nu: kenmerken van relaties tussen variabelen
  • Correlatie: meet lineaire relaties
  • Financiële markten: belangrijk voor voorspellen en risicobeheer
  • pandas & seaborn bieden tools om te berekenen en te visualiseren
Tijdreeksgegevens manipuleren in Python

Correlatie & lineaire relaties

  • Correlatiecoëfficiënt: hoe gelijk bewegen twee variabelen rond hun gemiddelden?
  • Waarden tussen -1 en +1 $\ \ \ \ \ r = \frac{\sum_{i=1}^{N} (x_i - \bar{x})(y_i - \bar{y})}{s_xs_y}$

 

ch3_4_v2 - Correlation & Heatmaps.011.png

Tijdreeksgegevens manipuleren in Python

Vijf prijstijdreeksen importeren

data = pd.read_csv('assets.csv', parse_dates=['date'], 
                   index_col='date')

data = data.dropna().info()
DatetimeIndex: 2469 entries, 2007-05-25 to 2017-05-22
Data columns (total 5 columns):
sp500     2469 non-null float64
nasdaq    2469 non-null float64
bonds     2469 non-null float64
gold      2469 non-null float64
oil       2469 non-null float64
Tijdreeksgegevens manipuleren in Python

Pairwise lineaire relaties visualiseren

daily_returns = data.pct_change()

sns.jointplot(x='sp500', y='nasdaq', data=data_returns);

ch3_4_v2 - Correlation & Heatmaps.015.png

Tijdreeksgegevens manipuleren in Python

Alle correlaties berekenen

correlations = returns.corr()

correlations
bonds       oil      gold     sp500    nasdaq
bonds   1.000000 -0.183755  0.003167 -0.300877 -0.306437
oil    -0.183755  1.000000  0.105930  0.335578  0.289590
gold    0.003167  0.105930  1.000000 -0.007786 -0.002544
sp500  -0.300877  0.335578 -0.007786  1.000000  0.959990
nasdaq -0.306437  0.289590 -0.002544  0.959990  1.000000
Tijdreeksgegevens manipuleren in Python

Visualiseer alle correlaties

sns.heatmap(correlations, annot=True)

ch3_4_v2 - Correlation & Heatmaps.019.png

Tijdreeksgegevens manipuleren in Python

Laten we oefenen!

Tijdreeksgegevens manipuleren in Python

Preparing Video For Download...