Relations entre séries temporelles : corrélation

Manipuler des séries temporelles en Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Corrélation et relations entre séries

  • Jusqu’ici : caractéristiques de variables individuelles
  • Maintenant : relations entre variables
  • Corrélation : mesure les relations linéaires
  • Marchés financiers : utile pour prévision et gestion du risque
  • pandas et seaborn fournissent calcul et visualisation
Manipuler des séries temporelles en Python

Corrélation et relations linéaires

  • Coefficient de corrélation : similarité des mouvements de deux variables autour de leur moyenne
  • Vaut entre -1 et +1 $\ \ \ \ \ r = \frac{\sum_{i=1}^{N} (x_i - \bar{x})(y_i - \bar{y})}{s_xs_y}$

 

ch3_4_v2 - Correlation & Heatmaps.011.png

Manipuler des séries temporelles en Python

Importer cinq séries de prix

data = pd.read_csv('assets.csv', parse_dates=['date'], 
                   index_col='date')

data = data.dropna().info()
DatetimeIndex: 2469 entries, 2007-05-25 to 2017-05-22
Data columns (total 5 columns):
sp500     2469 non-null float64
nasdaq    2469 non-null float64
bonds     2469 non-null float64
gold      2469 non-null float64
oil       2469 non-null float64
Manipuler des séries temporelles en Python

Visualiser les relations linéaires par paire

daily_returns = data.pct_change()

sns.jointplot(x='sp500', y='nasdaq', data=data_returns);

ch3_4_v2 - Correlation & Heatmaps.015.png

Manipuler des séries temporelles en Python

Calculer toutes les corrélations

correlations = returns.corr()

correlations
bonds       oil      gold     sp500    nasdaq
bonds   1.000000 -0.183755  0.003167 -0.300877 -0.306437
oil    -0.183755  1.000000  0.105930  0.335578  0.289590
gold    0.003167  0.105930  1.000000 -0.007786 -0.002544
sp500  -0.300877  0.335578 -0.007786  1.000000  0.959990
nasdaq -0.306437  0.289590 -0.002544  0.959990  1.000000
Manipuler des séries temporelles en Python

Visualiser toutes les corrélations

sns.heatmap(correlations, annot=True)

ch3_4_v2 - Correlation & Heatmaps.019.png

Manipuler des séries temporelles en Python

Passons à la pratique !

Manipuler des séries temporelles en Python

Preparing Video For Download...