Autres méthodes datetime dans Pandas

Utilisation des dates et des heures en Python

Max Shron

Data Scientist & Author

Fuseaux horaires dans Pandas

rides['Duration'].dt.total_seconds().min()
-3346.0
Utilisation des dates et des heures en Python

Fuseaux horaires dans Pandas

rides['Start date'].head(3)
0   2017-10-01 15:23:25
1   2017-10-01 15:42:57
2   2017-10-02 06:37:10
Name: Start date, dtype: datetime64[ns]
rides['Start date'].head(3)\
  .dt.tz_localize('America/New_York')
0   2017-10-01 15:23:25-04:00
1   2017-10-01 15:42:57-04:00
2   2017-10-02 06:37:10-04:00
Name: Start date, dtype: datetime64[ns, America/New_York]
Utilisation des dates et des heures en Python

Fuseaux horaires dans Pandas

# Tenter de définir un fuseau horaire…
rides['Start date'] = rides['Start date']\
  .dt.tz_localize('America/New_York')
pytz.exceptions.AmbiguousTimeError: Cannot infer dst time from '2017-11-05 01:56:50', 
try using the 'ambiguous' argument
# Gérer les datetimes ambigus
rides['Start date'] = rides['Start date']\
  .dt.tz_localize('America/New_York', ambiguous='NaT')

rides['End date'] = rides['End date']\
  .dt.tz_localize('America/New_York', ambiguous='NaT')
Utilisation des dates et des heures en Python

Fuseaux horaires dans Pandas

# Recalculer la durée, en ignorant la ligne erronée
rides['Duration'] = rides['End date'] - rides['Start date']

# Rechercher à nouveau le minimum rides['Duration'].dt.total_seconds().min()
116.0
Utilisation des dates et des heures en Python

Fuseaux horaires dans Pandas

# Examiner la ligne problématique
rides.iloc[129]
Duration                            NaT
Start date                          NaT
End date                            NaT
Start station             6th & H St NE
End station               3rd & M St NE
Bike number                      W20529
Member type                      Member
Name: 129, dtype: object
Utilisation des dates et des heures en Python

Autres opérations datetime dans Pandas

# Année des trois premières lignes
rides['Start date']\
  .head(3)\
  .dt.year
0    2017
1    2017
2    2017
Name: Start date, dtype: int64
# Jours de la semaine pour les trois premiers trajets
rides['Start date']\
  .head(3)\
  .dt.day_name()
0    Sunday
1    Sunday
2    Monday
Name: Start date, dtype: object
Utilisation des dates et des heures en Python

Autres parties de Pandas

# Décaler les index d’un cran vers l’avant, en remplissant avec NaT
rides['End date'].shift(1).head(3)
0                         NaT
1   2017-10-01 15:26:26-04:00
2   2017-10-01 17:49:59-04:00
Name: End date, dtype: datetime64[ns, America/New_York]
Utilisation des dates et des heures en Python

Autres méthodes datetime dans Pandas

Utilisation des dates et des heures en Python

Preparing Video For Download...