Menelisik join satu-satu

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

John Miller

Principal Data Scientist

Dasar-dasar pandas.merge()

$$

  • Dipakai untuk data saling melengkapi
  • pd.merge(left, right)
  • Join pada satu atau lebih kolom
  • Mirip VLOOKUP

kayu tersambung

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Left merge

left merge

$$

pd.merge(df_left, df_right, 
         on='GameKey', how='left')
  • Cantumkan nama data frame untuk placeholder "df_left" dan "df_right"
  • Hasil baris mengikuti frame kiri
Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Right merge

right merge

$$

pd.merge(df_left, df_right, 
         on='GameKey', how='right')
  • Konsep sama dengan left merge
  • Hasil baris mengikuti frame kanan
Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Kerangka kerja untuk join

$$

Setelah meninjau dan memahami data:

  • Tentukan relasinya
  • Periksa nilai unik di kolom kunci
  • Tulis pernyataan merge dan jalankan

persegi

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Join dengan dua kunci

$$ merge multi-kunci

$$

  • Tentukan relasinya
  • Periksa nilai unik di kolom kunci
  • Tulis pernyataan merge dan jalankan

$$

 pd.merge(df_left, df_right,
           on=['GameKey', 'PlayId'])
Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Ayo berlatih!

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Preparing Video For Download...