Relações entre séries temporais: correlação

Manipulando dados de séries temporais em Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Correlação e relações entre séries

  • Até aqui: foco nas características de variáveis individuais
  • Agora: características das relações entre variáveis
  • Correlação: mede relações lineares
  • Mercados financeiros: útil para previsão e risco
  • pandas e seaborn têm ferramentas para calcular e visualizar
Manipulando dados de séries temporais em Python

Correlação e relações lineares

  • Coeficiente de correlação: quão parecido é o movimento par a par de duas variáveis em torno de suas médias?
  • Varia entre -1 e +1 $\ \ \ \ \ r = \frac{\sum_{i=1}^{N} (x_i - \bar{x})(y_i - \bar{y})}{s_xs_y}$

 

ch3_4_v2 - Correlation & Heatmaps.011.png

Manipulando dados de séries temporais em Python

Importando cinco séries de preços

data = pd.read_csv('assets.csv', parse_dates=['date'], 
                   index_col='date')

data = data.dropna().info()
DatetimeIndex: 2469 entries, 2007-05-25 to 2017-05-22
Data columns (total 5 columns):
sp500     2469 non-null float64
nasdaq    2469 non-null float64
bonds     2469 non-null float64
gold      2469 non-null float64
oil       2469 non-null float64
Manipulando dados de séries temporais em Python

Visualizar relações lineares par a par

daily_returns = data.pct_change()

sns.jointplot(x='sp500', y='nasdaq', data=data_returns);

ch3_4_v2 - Correlation & Heatmaps.015.png

Manipulando dados de séries temporais em Python

Calcular todas as correlações

correlations = returns.corr()

correlations
bonds       oil      gold     sp500    nasdaq
bonds   1.000000 -0.183755  0.003167 -0.300877 -0.306437
oil    -0.183755  1.000000  0.105930  0.335578  0.289590
gold    0.003167  0.105930  1.000000 -0.007786 -0.002544
sp500  -0.300877  0.335578 -0.007786  1.000000  0.959990
nasdaq -0.306437  0.289590 -0.002544  0.959990  1.000000
Manipulando dados de séries temporais em Python

Visualizar todas as correlações

sns.heatmap(correlations, annot=True)

ch3_4_v2 - Correlation & Heatmaps.019.png

Manipulando dados de séries temporais em Python

Vamos praticar!

Manipulando dados de séries temporais em Python

Preparing Video For Download...