Memperluas fungsi window dengan pandas

Memanipulasi Data Deret Waktu di Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Expanding windows di pandas

  • Dari rolling ke expanding windows
  • Hitung metrik hingga tanggal saat ini
  • Deret waktu baru mencerminkan seluruh riwayat
  • Berguna untuk return berjalan, min/maks berjalan
  • Dua opsi di pandas:
    • .expanding() - mirip .rolling()
    • .cumsum(), .cumprod(), cummin()/max()
Memanipulasi Data Deret Waktu di Python

Gagasan dasar

df = pd.DataFrame({'data': range(5)})

df['expanding sum'] = df.data.expanding().sum()
df['cumulative sum'] = df.data.cumsum()
df
   data  expanding sum  cumulative sum
0     0            0.0               0
1     1            1.0               1
2     2            3.0               3
3     3            6.0               6
4     4           10.0              10
Memanipulasi Data Deret Waktu di Python

Ambil data S&P 500

data = pd.read_csv('sp500.csv', parse_dates=['date'], index_col='date')
DatetimeIndex: 2519 entries, 2007-05-24 to 2017-05-24
Data columns (total 1 columns):
SP500    2519 non-null float64

ch3_2_v2 - Fungsi Window Expanding dengan Pandas.013.png

Memanipulasi Data Deret Waktu di Python

Cara menghitung return berjalan

  • Return satu periode $r_t$: harga saat ini dibagi harga sebelumnya dikurangi 1:

    $$r_t = \frac{P_t}{P_{t-1}} - 1$$

    • Return multi-periode: hasil kali $(1 + r_t)$ untuk semua periode, lalu kurangi 1:

    $$R_T = (1 + r_1)(1 + r_2)...(1 + r_T) - 1$$

    • Return periode: .pct_change()
    • Operasi dasar: .add(), .sub(), .mul(), .div()
    • Hasil kali kumulatif: .cumprod()
Memanipulasi Data Deret Waktu di Python

Tingkat pengembalian berjalan dalam praktik

pr = data.SP500.pct_change() # period return

pr_plus_one = pr.add(1)
cumulative_return = pr_plus_one.cumprod().sub(1)
cumulative_return.mul(100).plot()

ch3_2_v2 - Fungsi Window Expanding dengan Pandas.021.png

Memanipulasi Data Deret Waktu di Python

Mendapatkan min & max berjalan

data['running_min'] = data.SP500.expanding().min()

data['running_max'] = data.SP500.expanding().max()
data.plot()

ch3_2_v2 - Fungsi Window Expanding dengan Pandas.023.png

Memanipulasi Data Deret Waktu di Python

Tingkat pengembalian tahunan bergulir

def multi_period_return(period_returns):
    return np.prod(period_returns + 1) - 1

pr = data.SP500.pct_change() # return periode
r = pr.rolling('360D').apply(multi_period_return)
data['Rolling 1yr Return'] = r.mul(100)
data.plot(subplots=True)
Memanipulasi Data Deret Waktu di Python

Tingkat pengembalian tahunan bergulir

data['Rolling 1yr Return'] = r.mul(100)

data.plot(subplots=True)

ch3_2_v2 - Fungsi Window Expanding dengan Pandas.027.png

Memanipulasi Data Deret Waktu di Python

Ayo berlatih!

Memanipulasi Data Deret Waktu di Python

Preparing Video For Download...