Groeperen op meerdere kolommen

Python voor spreadsheetgebruikers

Chris Cardillo

Data Scientist

Fruitverkopen

fruit_sales veel fruitverkopen.png

fruit_sales.info() fruitverkopen info.png

Python voor spreadsheetgebruikers

Fruitverkopen

fruit_sales veel fruitverkopen.png

fruit_sales.info() fruitverkopen info gemarkeerd.png

Python voor spreadsheetgebruikers

Fruitverkopen

veel appels.png

Python voor spreadsheetgebruikers

Een lijst met kolomnamen toevoegen

Voor
fruit_sales.groupby('store', as_index=False).sum()
Na
fruit_sales.groupby(['store', 'product_name'], as_index=False).sum()
Python voor spreadsheetgebruikers

Wat is een list?

shopping_list = ['milk', 'eggs', 'cheese']
Python voor spreadsheetgebruikers

Per winkel, per fruitsoort

groups = ['store', 'product_name']

fruit_sales_less = fruit_sales.groupby(groups, as_index=False).sum()

gegroepeerd en samengevat.png

Python voor spreadsheetgebruikers

Per winkel, per fruitsoort

groups = ['store', 'product_name']

fruit_sales_less = fruit_sales.groupby(groups, as_index=False).sum()

nu één appel.png

Python voor spreadsheetgebruikers

Voordelen van groeperen op meer kolommen vóór .sum()

  • Het is niet "alles of niets"
  • Breng data terug tot wat telt
  • Maakt spreadsheetdata beheersbaarder
Python voor spreadsheetgebruikers

Jij bent aan de beurt!

Python voor spreadsheetgebruikers

Preparing Video For Download...