Datum/tijd-gegevens samenvatten in Pandas

Werken met datums en tijden in Python

Max Shron

Data Scientist and Author

Gegevens samenvatten in Pandas

# Gemiddelde tijd buiten de steiger
rides['Duration'].mean()
Timedelta('0 days 00:19:38.931034482')
# Totale tijd buiten de steiger
rides['Duration'].sum()
Timedelta('3 days 22:58:10')
Werken met datums en tijden in Python

Gegevens samenvatten in Pandas

# Percentage tijd buiten de steiger
rides['Duration'].sum() / timedelta(days=91)
0.04348417785917786
Werken met datums en tijden in Python

Gegevens samenvatten in Pandas

# Tel hoe vaak de fiets bij elk station startte
rides['Member type'].value_counts()
Member 236
Casual  54
Name: Member type, dtype: int64
# Percentage ritten per lidmaatschap
rides['Member type'].value_counts() / len(rides)
Member 0.814 
Casual 0.186 
Name: Member type, dtype: float64
Werken met datums en tijden in Python

Datum/tijd samenvatten in Pandas

# Kolom met duur (in seconden) toevoegen
rides['Duration seconds'] = rides['Duration'].dt.total_seconds()

# Gem. duur per lidmaatschapstype rides.groupby('Member type')['Duration seconds'].mean()
Member type 
Casual 1994.667 
Member 992.280 
Name: Duration seconds, dtype: float64
Werken met datums en tijden in Python

Datum/tijd samenvatten in Pandas

# Gem. duur per maand
rides.resample('ME', on = 'Start date')['Duration seconds'].mean()
  • Veelgebruikte frequenties: D (dagelijks), W (wekelijks), ME (maandeinde), YE (jaareinde)
Start date 
2017-10-31 1886.454 
2017-11-30 854.175 
2017-12-31 635.101 
Freq: ME, Name: Duration seconds, dtype: float64
Werken met datums en tijden in Python

Datum/tijd samenvatten in Pandas

# Aantal per groep
rides.groupby('Member type').size()
Member type
Casual     54
Member    236
dtype: int64
# Eerste rit per groep
rides.groupby('Member type').first()
            Duration     ...     
Member type              ...
Casual      02:07:02     ...        
Member      00:03:01     ...
Werken met datums en tijden in Python

Datum/tijd samenvatten in Pandas

rides\
  .resample('ME', on = 'Start date')\
  ['Duration seconds']\
  .mean()\
  .plot()

Werken met datums en tijden in Python

Datum/tijd samenvatten in Pandas

rides\
  .resample('D', on = 'Start date')\
  ['Duration seconds']\
  .mean()\
  .plot()

Werken met datums en tijden in Python

Datum/tijd-gegevens samenvatten in Pandas

Werken met datums en tijden in Python

Preparing Video For Download...