Lags, veranderingen en rendementen voor aandelenkoersen

Tijdreeksgegevens manipuleren in Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Basisberekeningen voor tijdreeksen

  • Veelvoorkomende bewerkingen op tijdreeksen:

    • Waarden vooruit of achteruit verschuiven (lag)

    • Verschil in waarde voor een gegeven periode

    • Procentuele verandering over meerdere periodes

  • Ingebouwde pandas-methoden werken met pd.DateTimeIndex

Tijdreeksgegevens manipuleren in Python

GOOG-aandelenkoersen ophalen

  • Laat pd.read_csv() het parsen voor je doen!
google = pd.read_csv('google.csv', parse_dates=['date'], index_col='date')
google.info()
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 504 entries, 2015-01-02 to 2016-12-30
Data columns (total 1 columns):
price    504 non-null float64
dtypes: float64(1)
Tijdreeksgegevens manipuleren in Python

GOOG-aandelenkoersen ophalen

google.head()
             price
date
2015-01-02  524.81
2015-01-05  513.87
2015-01-06  501.96
2015-01-07  501.10
2015-01-08  502.68
Tijdreeksgegevens manipuleren in Python

.shift(): data tussen verleden en toekomst verplaatsen

  • .shift():
    • standaard periods=1
    • 1 periode de toekomst in
google['shifted'] = google.price.shift() # default: periods=1

google.head(3)
             price  shifted
date
2015-01-02  542.81      NaN
2015-01-05  513.87   542.81
2015-01-06  501.96   513.87
Tijdreeksgegevens manipuleren in Python

.shift(): data tussen verleden en toekomst verplaatsen

  • .shift(periods=-1):
    • achtergestelde data (lag)
    • 1 periode terug in de tijd
google['lagged'] = google.price.shift(periods=-1)

google[['price', 'lagged', 'shifted']].tail(3)
             price  lagged  shifted
date
2016-12-28  785.05  782.79   791.55
2016-12-29  782.79  771.82   785.05
2016-12-30  771.82     NaN   782.79
Tijdreeksgegevens manipuleren in Python

Eén-periode procentuele verandering berekenen

  • $x_t$ / $x_{t-1}$
google['change'] = google.price.div(google.shifted)

google[['price', 'shifted', 'change']].head(3)
             price  shifted    change
Date
2017-01-03  786.14      NaN       NaN
2017-01-04  786.90   786.14  1.000967
2017-01-05  794.02   786.90  1.009048
Tijdreeksgegevens manipuleren in Python

Eén-periode procentuele verandering berekenen

google['return'] = google.change.sub(1).mul(100)

google[['price', 'shifted', 'change', 'return']].head(3)
             price  shifted  change  return
date
2015-01-02  524.81      NaN     NaN     NaN
2015-01-05  513.87   524.81    0.98   -2.08
2015-01-06  501.96   513.87    0.98   -2.32
Tijdreeksgegevens manipuleren in Python

.diff(): ingebouwde tijdreeksverandering

  • Verschil tussen twee opeenvolgende periodes

  • $x_t - x_{t-1}$

google['diff'] = google.price.diff()

google[['price', 'diff']].head(3)
             price        diff
date
2015-01-02  524.81         NaN
2015-01-05  513.87      -10.94
2015-01-06  501.96      -11.91
Tijdreeksgegevens manipuleren in Python

.pct_change(): ingebouwde %‑verandering voor tijdreeksen

  • Procentuele verandering tussen twee opeenvolgende periodes

  • $\frac{x_t}{x_{t-1}}$

google['pct_change'] = google.price.pct_change().mul(100)

google[['price', 'return', 'pct_change']].head(3)
             price    return  pct_change
date
2015-01-02  524.81       NaN         NaN
2015-01-05  513.87     -2.08       -2.08
2015-01-06  501.96     -2.32       -2.32
Tijdreeksgegevens manipuleren in Python

Vooruitkijken: rendementen over meerdere periodes

google['return_3d'] = google.price.pct_change(periods=3).mul(100)

google[['price', 'return_3d']].head()
             price  return_3d
date
2015-01-02  524.81        NaN
2015-01-05  513.87        NaN
2015-01-06  501.96        NaN
2015-01-07  501.10  -4.517825
2015-01-08  502.68  -2.177594
  • Procentuele verandering over twee periodes, 3 handelsdagen ertussen
Tijdreeksgegevens manipuleren in Python

Laten we oefenen!

Tijdreeksgegevens manipuleren in Python

Preparing Video For Download...