Kracht en flexibiliteit

Pandas-joins voor spreadsheetgebruikers

John Miller

Principal Data Scientist

Schaalbaarheid

$$

  • Geen harde limiet op dataframegrootte
  • Ingebouwde manieren om data te "chunken"
  • Gebruik gedistribueerd/parallel rekenen

geschaalde data cartoon

Pandas-joins voor spreadsheetgebruikers

Efficiëntie

$$

efficiënte panda cartoon

$$

  • Joinen op meerdere kolommen
  • Voorkeur voor eenvoudige code
joined_df = left_df.merge(right_df)
Pandas-joins voor spreadsheetgebruikers

Integratie

$$

  • Betere snelheid en schaal
  • Datavisualisatie
  • Machine learning

python-ecosysteem

Pandas-joins voor spreadsheetgebruikers

Een woord over geavanceerd spreadsheetgebruik

$$

  • Datamodellen en querytools
  • Programmeertalen
  • Geavanceerde formules
Pandas-joins voor spreadsheetgebruikers

Laten we oefenen!

Pandas-joins voor spreadsheetgebruikers

Preparing Video For Download...