Werken met tijdgegevens

Pandas-joins voor spreadsheetgebruikers

John Miller

Principal Data Scientist

Joinen met .merge_ordered()

time-series merge no result

pd.merge_ordered(cleveland, dallas, on='Game_Date', 
                suffixes=['_CLE', '_DAL'])
Pandas-joins voor spreadsheetgebruikers

Joinen met .merge_ordered()

time-series merge

pd.merge_ordered(cleveland, dallas, on='Game_Date', 
                suffixes=['_CLE', '_DAL'])
Pandas-joins voor spreadsheetgebruikers

Data interpoleren

interpolate on merge

pd.merge_ordered(tc2, td2, on='Game_Date', 
                suffixes=['_CLE', '_DAL'], fill_method='ffill')
Pandas-joins voor spreadsheetgebruikers

Data interpoleren

fgf

pd.merge_ordered(tc2, td2, on='Game_Date', 
                suffixes=['_CLE', '_DAL'], fill_method='ffill')
Pandas-joins voor spreadsheetgebruikers

Mergen op dichtstbijzijnde datums/tijden

  • pandas.merge_asof()
  • matcht op dichtstbijzijnde datum
  • vergelijkbaar met VLOOKUP(range_lookup=TRUE)
pd.merge_asof(left_df, right_df,
              direction='backward')

Richtingen

  • "backward": dichtstbij, eerder

  • "forward": dichtstbij, gelijk of later

  • "nearest": dichtstbij, ongeacht

Pandas-joins voor spreadsheetgebruikers

Voorbeeld van merge_asof

merge_asof

pd.merge_asof(temps, impacts,
              left_on='Game_Date', right_index=True, direction='backward')
Pandas-joins voor spreadsheetgebruikers

Laten we oefenen!

Pandas-joins voor spreadsheetgebruikers

Preparing Video For Download...