Data samenvoegen: een noodzaak in de praktijk
Pandas-joins voor spreadsheetgebruikers
John Miller
Principal Data Scientist
Pandas voor spreadsheetgebruikers
Leer op basis van overeenkomsten met spreadsheets
Begrijp de kracht en flexibiliteit van pandas
Gebruik data van de National Football League (NFL)
Veelvoorkomende situaties
$$
Datasets gesplitst naar tijd of andere factor
Datasets met gerelateerde factoren
Data splitsen
$$
Beïnvloed door de rapportagecyclus
Veelvoorkomende splitsingen
Tijd
Geografie
Businessunit
Voorbeeld: gesplitste data
Voorbeeld: gesplitste data
Voorbeeld: gesplitste data
Aanvullende data
$$
Ontstaat doordat data voor verschillende doelen wordt verzameld
Afdelingsspecifieke data
Opslag in aparte bestanden of databasetabellen
Voorbeeld: aanvullende data
$$
Voorbeeld: aanvullende data
$$
Voorbeeld: aanvullende data
$$
Laten we oefenen!
Pandas-joins voor spreadsheetgebruikers
Preparing Video For Download...