Arbeiten mit Datums- und Zeitangaben in Python
Max Shron
Data Scientist and Author
# Durchschnittliche Zeit außerhalb des Docks
rides['Duration'].mean()
Timedelta('0 days 00:19:38.931034482')
# Gesamte Zeit außerhalb des Docks
rides['Duration'].sum()
Timedelta('3 days 22:58:10')
# Anteil der Zeit außerhalb des Docks
rides['Duration'].sum() / timedelta(days=91)
0.04348417785917786
# Wie oft startete das Bike an jeder Station
rides['Member type'].value_counts()
Member 236
Casual 54
Name: Member type, dtype: int64
# Anteil der Fahrten nach Mitgliedstyp
rides['Member type'].value_counts() / len(rides)
Member 0.814
Casual 0.186
Name: Member type, dtype: float64
# Dauer-Spalte (in Sekunden) hinzufügen rides['Duration seconds'] = rides['Duration'].dt.total_seconds()# Durchschnittsdauer pro Mitgliedstyp rides.groupby('Member type')['Duration seconds'].mean()
Member type
Casual 1994.667
Member 992.280
Name: Duration seconds, dtype: float64
# Durchschnittsdauer pro Monat
rides.resample('ME', on = 'Start date')['Duration seconds'].mean()
D (täglich), W (wöchentlich), ME (Monatsende), YE (Jahresende)Start date
2017-10-31 1886.454
2017-11-30 854.175
2017-12-31 635.101
Freq: ME, Name: Duration seconds, dtype: float64
# Größe pro Gruppe
rides.groupby('Member type').size()
Member type
Casual 54
Member 236
dtype: int64
# Erste Fahrt je Gruppe
rides.groupby('Member type').first()
Duration ...
Member type ...
Casual 02:07:02 ...
Member 00:03:01 ...
rides\
.resample('ME', on = 'Start date')\
['Duration seconds']\
.mean()\
.plot()

rides\
.resample('D', on = 'Start date')\
['Duration seconds']\
.mean()\
.plot()

Arbeiten mit Datums- und Zeitangaben in Python