Join pada kolom kunci

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

John Miller

Principal Data Scientist

Kerangka kerja (lanjutan)

$$

Setelah meninjau dan memahami data:

  • Tentukan relasi
  • Periksa nilai unik di kolom kunci

persegi

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Kolom kunci unik

$$ $$ Nilai unik untuk kunci satu kolom

df.duplicated('GameKey').sum()

$$ -- -- -- Nilai 0 berarti tidak ada duplikat -- -- --

df.duplicated(['GameKey', 'PlayId').sum()

indeks satu kolom

indeks multi-kolom

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Kerangka kerja (lanjutan)

$$

Setelah meninjau dan memahami data:

  • Tentukan relasi
  • Periksa nilai unik di kolom kunci
  • Tulis perintah merge dan jalankan

persegi

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Menjalankan merge

$$

Pernyataannya sama!

df1.merge(df2, how='inner', on='')

  • Perhatikan parameter

$$

Sintaks lengkap: DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Memvalidasi merge

DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

$$

Nilai untuk validate:

  • “one_to_one” atau “1:1”
  • “one_to_many” atau “1:m”
  • “many_to_one” atau “m:1”
  • “many_to_many” atau “m:m” (tidak berdampak)
Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Ayo berlatih!

Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet

Preparing Video For Download...