Zusätzliche Datetime-Methoden in Pandas

Arbeiten mit Datums- und Zeitangaben in Python

Max Shron

Data Scientist & Author

Zeitzonen in Pandas

rides['Duration'].dt.total_seconds().min()
-3346.0
Arbeiten mit Datums- und Zeitangaben in Python

Zeitzonen in Pandas

rides['Start date'].head(3)
0   2017-10-01 15:23:25
1   2017-10-01 15:42:57
2   2017-10-02 06:37:10
Name: Start date, dtype: datetime64[ns]
rides['Start date'].head(3)\
  .dt.tz_localize('America/New_York')
0   2017-10-01 15:23:25-04:00
1   2017-10-01 15:42:57-04:00
2   2017-10-02 06:37:10-04:00
Name: Start date, dtype: datetime64[ns, America/New_York]
Arbeiten mit Datums- und Zeitangaben in Python

Zeitzonen in Pandas

# Versuche, eine Zeitzone zu setzen …
rides['Start date'] = rides['Start date']\
  .dt.tz_localize('America/New_York')
pytz.exceptions.AmbiguousTimeError: Cannot infer dst time from '2017-11-05 01:56:50', 
try using the 'ambiguous' argument
# Mehrdeutige Datetimes behandeln
rides['Start date'] = rides['Start date']\
  .dt.tz_localize('America/New_York', ambiguous='NaT')

rides['End date'] = rides['End date']\
  .dt.tz_localize('America/New_York', ambiguous='NaT')
Arbeiten mit Datums- und Zeitangaben in Python

Zeitzonen in Pandas

# Dauer neu berechnen, fehlerhafte Zeile ignorieren
rides['Duration'] = rides['End date'] - rides['Start date']

# Minimum erneut suchen rides['Duration'].dt.total_seconds().min()
116.0
Arbeiten mit Datums- und Zeitangaben in Python

Zeitzonen in Pandas

# Problematische Zeile ansehen
rides.iloc[129]
Duration                            NaT
Start date                          NaT
End date                            NaT
Start station             6th & H St NE
End station               3rd & M St NE
Bike number                      W20529
Member type                      Member
Name: 129, dtype: object
Arbeiten mit Datums- und Zeitangaben in Python

Weitere Datetime-Operationen in Pandas

# Jahr der ersten drei Zeilen
rides['Start date']\
  .head(3)\
  .dt.year
0    2017
1    2017
2    2017
Name: Start date, dtype: int64
# Wochentage für die ersten drei Fahrten
rides['Start date']\
  .head(3)\
  .dt.day_name()
0    Sunday
1    Sunday
2    Monday
Name: Start date, dtype: object
Arbeiten mit Datums- und Zeitangaben in Python

Andere Teile von Pandas

# Indizes um eins nach vorn schieben, mit NaT auffüllen
rides['End date'].shift(1).head(3)
0                         NaT
1   2017-10-01 15:26:26-04:00
2   2017-10-01 17:49:59-04:00
Name: End date, dtype: datetime64[ns, America/New_York]
Arbeiten mit Datums- und Zeitangaben in Python

Zusätzliche Datetime-Methoden in Pandas

Arbeiten mit Datums- und Zeitangaben in Python

Preparing Video For Download...