Gemeenschappelijke data combineren met inner joins

Pandas-joins voor spreadsheetgebruikers

John Miller

Principal Data Scientist

Objectgeoriënteerde expressies

$$ pandas-functie op topniveau:

pd.merge(df_left, df_right, on=None)

$$

Korte notatie, pandas DataFrame-methode:

df_left.merge(df_right, on=None)
Pandas-joins voor spreadsheetgebruikers

Een eenvoudige inner join

inner join

  • Vergelijkbaar met VERT.ZOEKEN gevolgd door NA's verwijderen
df1.merge(df2, on='GameKey', how='inner') 
  • Geeft alleen rijen terug die in beide tabellen staan
Pandas-joins voor spreadsheetgebruikers

Joinen op verschillende namen

inner join met kolommen

  • Sleutelkolommen kunnen andere namen hebben
  • Kolommen hernoemen is niet nodig
    df1.merge(df2, left_on='GameKey', right_on='game-key',
               how='inner')
    
Pandas-joins voor spreadsheetgebruikers

Laten we oefenen!

Pandas-joins voor spreadsheetgebruikers

Preparing Video For Download...