Typen joins

Pandas-joins voor spreadsheetgebruikers

John Miller

Principal Data Scientist

Drie typen joins

  • Typen

    • Eén-op-één
    • Eén-op-veel
    • Veel-op-veel
  • Join-type geeft relatie tussen tabellen aan

  • Zoals opzoeken met VLOOKUP

data join cartoon

Pandas-joins voor spreadsheetgebruikers

Eén-op-één

één-op-één join voorbeeld

$$

  • Datasets op hetzelfde niveau
  • Lookup-kolom is in beide tabellen gelijk
  • Rijen matchen één-op-één
Pandas-joins voor spreadsheetgebruikers

Eén-op-veel

één-op-veel voorbeeld

$$

  • Rijen zijn uniek op verschillende niveaus
  • Join op de kolom van het hogere niveau
  • Resultaat op basis van het lagere niveau
  • Vergelijkbaar met VLOOKUP op lagere-niveaudata
Pandas-joins voor spreadsheetgebruikers

Veel-op-veel

veel-op-veel voorbeeld

$$

  • Waarden herhalen zich
  • Levert alle mogelijke combinaties op
  • Kan lastig te interpreteren zijn
  • Gebruik bij voorkeur een "bridge"-tabel
Pandas-joins voor spreadsheetgebruikers

Laten we oefenen!

Pandas-joins voor spreadsheetgebruikers

Preparing Video For Download...