Nauwer kijken naar one-to-one joins

Pandas-joins voor spreadsheetgebruikers

John Miller

Principal Data Scientist

Basics van pandas.merge()

$$

  • Gebruik met aanvullende data
  • pd.merge(left, right)
  • Join op één of meer kolommen
  • Vergelijkbaar met VLOOKUP

samengevoegd hout

Pandas-joins voor spreadsheetgebruikers

Left merges

left merge

$$

pd.merge(df_left, df_right, 
         on='GameKey', how='left')
  • Noem de dataframes voor de placeholders "df_left" en "df_right"
  • Resultaatrijen volgen het linker frame
Pandas-joins voor spreadsheetgebruikers

Right merges

right merge

$$

pd.merge(df_left, df_right, 
         on='GameKey', how='right')
  • Zelfde idee als left merge
  • Resultaatrijen volgen het rechter frame
Pandas-joins voor spreadsheetgebruikers

Een raamwerk voor joins

$$

Na het bekijken en begrijpen van de data:

  • Bepaal de relatie
  • Check unieke waarden in sleutelkolom
  • Schrijf en voer de merge uit

vierkanten

Pandas-joins voor spreadsheetgebruikers

Joinen op twee sleutels

$$ multikey merge

$$

  • Bepaal de relatie
  • Check unieke waarden in sleutelkolom
  • Schrijf en voer de merge uit

$$

 pd.merge(df_left, df_right,
           on=['GameKey', 'PlayId'])
Pandas-joins voor spreadsheetgebruikers

Laten we oefenen!

Pandas-joins voor spreadsheetgebruikers

Preparing Video For Download...