Zaman serisi frekansını değiştirme: yeniden örnekleme

Python ile Zaman Serisi Verilerini Manipüle Etme

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Frekansı değiştirme: yeniden örnekleme

  • DateTimeIndex: frekansı .asfreq() ile ayarlayın/değiştirin
  • Ancak frekans dönüşümü veriyi etkiler
    • Yukarı örnekleme: eksikleri doldurun veya enterpole edin
    • Aşağı örnekleme: mevcut veriyi toplayın
  • pandas API:
    • .asfreq(), .reindex()
    • .resample() + dönüştürme yöntemi
Python ile Zaman Serisi Verilerini Manipüle Etme

Başlangıç: üç aylık veri

dates = pd.date_range(start='2016', periods=4, freq='Q')

data = range(1, 5)
quarterly = pd.Series(data=data, index=dates)
quarterly
2016-03-31    1
2016-06-30    2
2016-09-30    3
2016-12-31    4
Freq: Q-DEC, dtype: int64 # Varsayılan: yıl sonu çeyrekler
Python ile Zaman Serisi Verilerini Manipüle Etme

Yukarı örnekleme: çeyrek => ay

monthly = quarterly.asfreq('M') # ay sonu frekansına
2016-03-31    1.0
2016-04-30    NaN
2016-05-31    NaN
2016-06-30    2.0
2016-07-31    NaN
2016-08-31    NaN
2016-09-30    3.0
2016-10-31    NaN
2016-11-30    NaN
2016-12-31    4.0
Freq: M, dtype: float64
  • Yukarı örnekleme eksik değerler yaratır
monthly = monthly.to_frame('baseline') # DataFrame'e dönüştür
Python ile Zaman Serisi Verilerini Manipüle Etme

Yukarı örnekleme: doldurma yöntemleri

monthly['ffill'] = quarterly.asfreq('M', method='ffill')

monthly['bfill'] = quarterly.asfreq('M', method='bfill')
monthly['value'] = quarterly.asfreq('M', fill_value=0)
Python ile Zaman Serisi Verilerini Manipüle Etme

Yukarı örnekleme: doldurma yöntemleri

  • bfill: geriye doldurma
  • ffill: ileriye doldurma
            baseline  ffill  bfill  value
2016-03-31       1.0      1      1      1
2016-04-30       NaN      1      2      0
2016-05-31       NaN      1      2      0
2016-06-30       2.0      2      2      2
2016-07-31       NaN      2      3      0
2016-08-31       NaN      2      3      0
2016-09-30       3.0      3      3      3
2016-10-31       NaN      3      4      0
2016-11-30       NaN      3      4      0
2016-12-31       4.0      4      4      4
Python ile Zaman Serisi Verilerini Manipüle Etme

Eksik ayları ekleme: .reindex()

dates = pd.date_range(start='2016', 
                      periods=12, 
                      freq='M')
DatetimeIndex(['2016-01-31', 
               '2016-02-29', 
               ..., 
               '2016-11-30', 
               '2016-12-31'],
        dtype='datetime64[ns]', freq='M')
  • .reindex():
    • DataFrame'i yeni indekse uydurur
    • .asfreq() ile aynı doldurma mantığı
quarterly.reindex(dates)
2016-01-31    NaN
2016-02-29    NaN
2016-03-31    1.0
2016-04-30    NaN
2016-05-31    NaN
2016-06-30    2.0
2016-07-31    NaN
2016-08-31    NaN
2016-09-30    3.0
2016-10-31    NaN
2016-11-30    NaN
2016-12-31    4.0
Python ile Zaman Serisi Verilerini Manipüle Etme

Hadi pratik yapalım!

Python ile Zaman Serisi Verilerini Manipüle Etme

Preparing Video For Download...