Uno sguardo più da vicino ai join uno-a-uno

Join con pandas per chi usa i fogli di calcolo

John Miller

Principal Data Scientist

Basi di pandas.merge()

$$

  • Usato con dati complementari
  • pd.merge(left, right)
  • Join su una o più colonne
  • Simile a VLOOKUP

giunzione legno

Join con pandas per chi usa i fogli di calcolo

Left merge

left merge

$$

pd.merge(df_left, df_right, 
         on='GameKey', how='left')
  • Inserisci i nomi dei DataFrame al posto di "df_left" e "df_right"
  • Il risultato ha le stesse righe del frame di sinistra
Join con pandas per chi usa i fogli di calcolo

Right merge

right merge

$$

pd.merge(df_left, df_right, 
         on='GameKey', how='right')
  • Stesso concetto del left merge
  • Il risultato ha le stesse righe del frame di destra
Join con pandas per chi usa i fogli di calcolo

Un framework per i join

$$

Dopo aver esaminato e capito i dati:

  • Determina la relazione
  • Verifica valori unici nella colonna chiave
  • Scrivi la merge e esegui

quadrati

Join con pandas per chi usa i fogli di calcolo

Join su due chiavi

$$ merge multi-chiave

$$

  • Determina la relazione
  • Verifica valori unici nella colonna chiave
  • Scrivi la merge e esegui

$$

 pd.merge(df_left, df_right,
           on=['GameKey', 'PlayId'])
Join con pandas per chi usa i fogli di calcolo

Passons à la pratique !

Join con pandas per chi usa i fogli di calcolo

Preparing Video For Download...