Anahtar sütunlarda birleştirme

Elektronik Tablo Kullanıcıları için pandas Join'leri

John Miller

Principal Data Scientist

Çerçeve (devam)

$$

Verileri inceledikten sonra:

  • İlişkiyi belirleyin
  • Anahtar sütundaki benzersiz değerleri kontrol edin

kareler

Elektronik Tablo Kullanıcıları için pandas Join'leri

Benzersiz anahtar sütunları

$$ $$ Tek sütun anahtar için benzersiz değerler

df.duplicated('GameKey').sum()

$$ -- -- 0 değeri, yinelenen yok demektir -- --

df.duplicated(['GameKey', 'PlayId']).sum()

tek sütun indeksi

çok sütunlu indeks

Elektronik Tablo Kullanıcıları için pandas Join'leri

Çerçeve (devam)

$$

Verileri inceledikten sonra:

  • İlişkiyi belirleyin
  • Anahtar sütundaki benzersiz değerleri kontrol edin
  • Birleştirme ifadesini yazın ve çalıştırın

kareler

Elektronik Tablo Kullanıcıları için pandas Join'leri

Birleştirmeyi yürütme

$$

İfade aynıdır!

df1.merge(df2, how='inner', on='')

  • Parametrelere dikkat edin

$$

Tam söz dizimi: DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), indicator=False, validate=None)

Elektronik Tablo Kullanıcıları için pandas Join'leri

Birleştirmeleri doğrulama

DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), indicator=False, validate=None)

$$

validate için değerler:

  • "one_to_one" veya "1:1"
  • "one_to_many" veya "1:m"
  • "many_to_one" veya "m:1"
  • "many_to_many" veya "m:m" (işlem yapmaz)
Elektronik Tablo Kullanıcıları için pandas Join'leri

Hadi pratik yapalım!

Elektronik Tablo Kullanıcıları için pandas Join'leri

Preparing Video For Download...