Umgang mit Datums- und Zeitangaben in pandas

Zeitreihen in Python bearbeiten

Stefan Jansen

Founder & Lead Data Scientist at Applied Artificial Intelligence

Funktionen für Datums- & Zeitreihen

  • Grundlage: Datentypen für Datum & Zeit
    • Objekte für Zeitpunkte und Perioden
    • Attribute & Methoden zu zeitbezogenen Details
  • Sequenzen von Daten & Perioden:
    • Series oder DataFrame-Spalten
    • Index: macht Objekte zu Zeitreihen
  • Viele Series-/DataFrame-Methoden nutzen Zeitinfos im Index für Zeitreihenfunktionen
Zeitreihen in Python bearbeiten

Grundbaustein: pd.Timestamp

import pandas as pd  # assumed imported going forward
from datetime import datetime  # To manually create dates

time_stamp = pd.Timestamp(datetime(2017, 1, 1))
pd.Timestamp('2017-01-01') == time_stamp
True # Versteht Datumsangaben als Strings
time_stamp # type: pandas.tslib.Timestamp
Timestamp('2017-01-01 00:00:00')
Zeitreihen in Python bearbeiten

Grundbaustein: pd.Timestamp

  • Timestamp-Objekt hat viele Attribute für zeitbezogene Infos
time_stamp.year
2017
time_stamp.day_name()
'Sunday'
Zeitreihen in Python bearbeiten

Weitere Bausteine: pd.Period & freq

period = pd.Period('2017-01')

period # default: month-end
Period('2017-01', 'M')
period.asfreq('D') # convert to daily
Period('2017-01-31', 'D')
period.to_timestamp().to_period('M')
Period('2017-01', 'M')

 

  • Period-Objekt hat das Attribut freq für Frequenzinfos

 

  • pd.Period() in pd.Timestamp() umwandeln und zurück
Zeitreihen in Python bearbeiten

Weitere Bausteine: pd.Period & freq

period + 2
Period('2017-03', 'M')
pd.Timestamp('2017-01-31', 'M') + 1
Timestamp('2017-02-28 00:00:00', freq='M')
  • Frequenzinfos ermöglichen einfache Datumsarithmetik
Zeitreihen in Python bearbeiten

Sequenzen von Daten & Zeiten

  • pd.date_range: start, end, periods, freq
index = pd.date_range(start='2017-1-1', periods=12, freq='M')
index
DatetimeIndex(['2017-01-31', '2017-02-28', '2017-03-31', ...,
               '2017-09-30', '2017-10-31', '2017-11-30', '2017-12-31'],
              dtype='datetime64[ns]', freq='M')
  • pd.DateTimeIndex: Folge von Timestamp-Objekten mit Frequenzinfo
Zeitreihen in Python bearbeiten

Sequenzen von Daten & Zeiten

index[0]
Timestamp('2017-01-31 00:00:00', freq='M')
index.to_period()
PeriodIndex(['2017-01', '2017-02', '2017-03', '2017-04', ..., 
             '2017-11', '2017-12'], dtype='period[M]', freq='M')
Zeitreihen in Python bearbeiten

Zeitreihe erstellen: pd.DateTimeIndex

pd.DataFrame({'data': index}).info()
RangeIndex: 12 entries, 0 to 11
Data columns (total 1 columns):
data    12 non-null datetime64[ns]
dtypes: datetime64[ns](1)
Zeitreihen in Python bearbeiten

Zeitreihe erstellen: pd.DateTimeIndex

  • np.random.random:
    • Zufallszahlen: [0,1]
    • 12 Zeilen, 2 Spalten
data = np.random.random((size=12,2))

pd.DataFrame(data=data, index=index).info()
DatetimeIndex: 12 entries, 2017-01-31 to 2017-12-31
Freq: M
Data columns (total 2 columns):
0    12 non-null float64
1    12 non-null float64
dtypes: float64(2)
Zeitreihen in Python bearbeiten

Frequenzkürzel & Zeitinfos

ch1_1_v2 -How to use Dates & Times with pandas.036.png

Zeitreihen in Python bearbeiten

Lass uns üben!

Zeitreihen in Python bearbeiten

Preparing Video For Download...