Gleitfensterfunktionen mit pandas

Zeitreihen in Python bearbeiten

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Fensterfunktionen in pandas

  • Fenster markieren Teilzeiträume deiner Zeitreihe
  • Berechne Kennzahlen für Teilzeiträume im Fenster
  • Erzeuge eine neue Zeitreihe dieser Kennzahlen
  • Zwei Fenstertypen:
    • Rolling: feste Größe, gleitend (dieses Video)
    • Expanding: enthält alle vorherigen Werte (nächstes Video)
Zeitreihen in Python bearbeiten

Gleitender Durchschnitt berechnen

data = pd.read_csv('google.csv', parse_dates=['date'], index_col='date')
DatetimeIndex: 1761 entries, 2010-01-04 to 2016-12-30
Data columns (total 1 columns):
price     1761 non-null float64
dtypes: float64(1)

ch3_1_v2 - Rolling Window Functions with Pandas.010.png

Zeitreihen in Python bearbeiten

Gleitender Durchschnitt berechnen

# Integerbasiertes Fenster
data.rolling(window=30).mean() # feste # Beobachtungen
DatetimeIndex: 1761 entries, 2010-01-04 to 2017-05-24
Data columns (total 1 columns):
price    1732 non-null float64
dtypes: float64(1)
  • window=30: # Börsentage
  • min_periods: < 30 wählen, um frühe Tage zu berechnen
Zeitreihen in Python bearbeiten

Gleitender Durchschnitt berechnen

# Offsetbasiertes Fenster
data.rolling(window='30D').mean() # feste Periodenlänge
DatetimeIndex: 1761 entries, 2010-01-04 to 2017-05-24
Data columns (total 1 columns):
price    1761 non-null float64
dtypes: float64(1)
  • 30D: # Kalendertage
Zeitreihen in Python bearbeiten

Gleitendes 90-Tage-Mittel

r90 = data.rolling(window='90D').mean()

google.join(r90.add_suffix('_mean_90')).plot()

ch3_1_v2 - Rolling Window Functions with Pandas.017.png

Zeitreihen in Python bearbeiten

Gleitende Mittel über 90 & 360 Tage

data['mean90'] = r90

r360 = data['price'].rolling(window='360D'.mean()
data['mean360'] = r360; data.plot()

ch3_1_v2 - Rolling Window Functions with Pandas.020.png

Zeitreihen in Python bearbeiten

Mehrere Gleitmetriken (1)

r = data.price.rolling('90D').agg(['mean', 'std'])

r.plot(subplots = True)

ch3_1_v2 - Rolling Window Functions with Pandas.022.png

Zeitreihen in Python bearbeiten

Mehrere Gleitmetriken (2)

rolling = data.google.rolling('360D')

q10 = rolling.quantile(0.1).to_frame('q10')
median = rolling.median().to_frame('median')
q90 = rolling.quantile(0.9).to_frame('q90')
pd.concat([q10, median, q90], axis=1).plot()

ch3_1_v2 - Rolling Window Functions with Pandas.024.png

Zeitreihen in Python bearbeiten

Lass uns üben!

Zeitreihen in Python bearbeiten

Preparing Video For Download...