Estudo de caso: simulação do S&P 500

Manipulando dados de séries temporais em Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Caminhadas aleatórias e simulações

Retornos diários de ações são difíceis de prever
Modelos geralmente assumem que são aleatórios
Numpy permite gerar números aleatórios
De retornos para preços: use .cumprod()
Dois exemplos:
- Gerar retornos aleatórios
- Retornos reais do SP500 selecionados aleatoriamente

Gerar números aleatórios

from numpy.random import normal, seed

from scipy.stats import norm

seed(42)

random_returns = normal(loc=0, scale=0.01, size=1000)

sns.distplot(random_returns, fit=norm, kde=False)

ch3_3_v2 - Case Study - SP500 Simulation.011.png

Criar um caminho de preço aleatório

return_series = pd.Series(random_returns)

random_prices = return_series.add(1).cumprod().sub(1)

random_prices.mul(100).plot()

ch3_3_v2 - Case Study - SP500 Simulation.013.png

Preços e retornos do S&P 500

data = pd.read_csv('sp500.csv', parse_dates=['date'], index_col='date')

data['returns'] = data.SP500.pct_change()

data.plot(subplots=True)

ch3_3_v2 - Case Study - SP500 Simulation.015.png

Distribuição de retornos do S&P

sns.distplot(data.returns.dropna().mul(100), fit=norm)

ch3_3_v2 - Case Study - SP500 Simulation.017.png

Gerar retornos aleatórios do S&P 500

from numpy.random import choice

sample = data.returns.dropna()

n_obs = data.returns.count()

random_walk = choice(sample, size=n_obs)

random_walk = pd.Series(random_walk, index=sample.index)

random_walk.head()

DATE
2007-05-29   -0.008357
2007-05-30    0.003702
2007-05-31   -0.013990
2007-06-01    0.008096
2007-06-04    0.013120

Preços aleatórios do S&P 500 (1)

start = data.SP500.first('D')

DATE
2007-05-25    1515.73
Name: SP500, dtype: float64

sp500_random = start.append(random_walk.add(1))

sp500_random.head())

DATE
2007-05-25    1515.730000
2007-05-29       0.998290
2007-05-30       0.995190
2007-05-31       0.997787
2007-06-01       0.983853
dtype: float64

Preços aleatórios do S&P 500 (2)

data['SP500_random'] = sp500_random.cumprod()

data[['SP500', 'SP500_random']].plot()

ch3_3_v2 - Case Study - SP500 Simulation.023.png

Vamos praticar!

Manipulando dados de séries temporais em Python