Pengindeksan & resampling deret waktu

Memanipulasi Data Deret Waktu di Python

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Transformasi deret waktu

Transformasi deret waktu dasar mencakup:

  • Mem-parse string tanggal dan mengonversi ke datetime64

  • Memilih & slicing untuk subperiode tertentu

  • Menyetel & mengubah frekuensi DateTimeIndex

    • Upsampling vs Downsampling
Memanipulasi Data Deret Waktu di Python

Mengambil harga saham GOOG

google = pd.read_csv('google.csv')  # import pandas as pd

google.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 504 entries, 0 to 503
Data columns (total 2 columns):
date     504 non-null object
price    504 non-null float64
dtypes: float64(1), object(1)
google.head()
         date   price
0  2015-01-02  524.81
1  2015-01-05  513.87
2  2015-01-06  501.96
3  2015-01-07  501.10
4  2015-01-08  502.68
Memanipulasi Data Deret Waktu di Python

Mengonversi tanggal string ke datetime64

  • pd.to_datetime():
    • Parse string tanggal
    • Konversi ke datetime64
google.date = pd.to_datetime(google.date)

google.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 504 entries, 0 to 503
Data columns (total 2 columns):
date     504 non-null datetime64[ns]
price    504 non-null float64
dtypes: datetime64[ns](1), float64(1)
Memanipulasi Data Deret Waktu di Python

Mengonversi tanggal string ke datetime64

  • .set_index():
    • Jadikan tanggal sebagai indeks
    • inplace:
      • tidak membuat salinan
google.set_index('date', inplace=True)

google.info()
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 504 entries, 2015-01-02 to 2016-12-30
Data columns (total 1 columns):
price    504 non-null float64
dtypes: float64(1)
Memanipulasi Data Deret Waktu di Python

Memvisualkan deret waktu saham Google

google.price.plot(title='Google Stock Price')

plt.tight_layout(); plt.show()

ch1_2_v2 - Pengindeksan & Resampling Deret Waktu.013.png

Memanipulasi Data Deret Waktu di Python

Pengindeksan string parsial

  • Memilih/mengindeks dengan string yang dapat diparse ke tanggal
google['2015'].info() # Beri string untuk bagian tanggal
DatetimeIndex: 252 entries, 2015-01-02 to 2015-12-31
Data columns (total 1 columns):
price    252 non-null float64
dtypes: float64(1)
google['2015-3': '2016-2'].info() # Slice mencakup bulan terakhir
DatetimeIndex: 252 entries, 2015-03-02 to 2016-02-29
Data columns (total 1 columns):
price    252 non-null float64
dtypes: float64(1)
memory usage: 3.9 KB
Memanipulasi Data Deret Waktu di Python

Pengindeksan string parsial

google.loc['2016-6-1', 'price'] # Gunakan tanggal penuh dengan .loc[]
734.15
Memanipulasi Data Deret Waktu di Python

.asfreq(): set frekuensi

  • .asfreq('D'):
    • Ubah DateTimeIndex ke frekuensi hari kalender
google.asfreq('D').info() # set frekuensi hari kalender
DatetimeIndex: 729 entries, 2015-01-02 to 2016-12-30
Freq: D
Data columns (total 1 columns):
price    504 non-null float64
dtypes: float64(1)
Memanipulasi Data Deret Waktu di Python

.asfreq(): set frekuensi

  • Upsampling:
    • Frekuensi lebih tinggi menambah tanggal baru => data hilang
google.asfreq('D').head()
             price
date              
2015-01-02  524.81
2015-01-03     NaN
2015-01-04     NaN
2015-01-05  513.87
2015-01-06  501.96
Memanipulasi Data Deret Waktu di Python

.asfreq(): set ulang frekuensi

  • .asfreq('B'):
    • Ubah DateTimeIndex ke frekuensi hari kerja
google = google.asfreq('B') # Ubah ke frekuensi hari kalender

google.info()
DatetimeIndex: 521 entries, 2015-01-02 to 2016-12-30
Freq: B
Data columns (total 1 columns):
price    504 non-null float64
dtypes: float64(1)
Memanipulasi Data Deret Waktu di Python

.asfreq(): set ulang frekuensi

google[google.price.isnull()] # Pilih nilai 'price' yang hilang
            price
date             
2015-01-19    NaN
2015-02-16    NaN
...
2016-11-24    NaN
2016-12-26    NaN
  • Hari kerja yang bukan hari perdagangan
Memanipulasi Data Deret Waktu di Python

Ayo berlatih!

Memanipulasi Data Deret Waktu di Python

Preparing Video For Download...