Data samenvoegen: een noodzaak in de praktijk

Pandas-joins voor spreadsheetgebruikers

John Miller

Principal Data Scientist

Pandas voor spreadsheetgebruikers

  • Leer op basis van overeenkomsten met spreadsheets
  • Begrijp de kracht en flexibiliteit van pandas
  • Gebruik data van de National Football League (NFL)

football punt

Pandas-joins voor spreadsheetgebruikers

Veelvoorkomende situaties

big data cartoon

$$

  • Datasets gesplitst naar tijd of andere factor
  • Datasets met gerelateerde factoren
Pandas-joins voor spreadsheetgebruikers

Data splitsen

$$

  • Beïnvloed door de rapportagecyclus
  • Veelvoorkomende splitsingen
    • Tijd
    • Geografie
    • Businessunit
Pandas-joins voor spreadsheetgebruikers

Voorbeeld: gesplitste data

datatabellen voor games

Pandas-joins voor spreadsheetgebruikers

Voorbeeld: gesplitste data

Gesplitste datakolommen

Pandas-joins voor spreadsheetgebruikers

Voorbeeld: gesplitste data

Sleutels voor gesplitste data

Pandas-joins voor spreadsheetgebruikers

Aanvullende data

$$

  • Ontstaat doordat data voor verschillende doelen wordt verzameld
  • Afdelingsspecifieke data
  • Opslag in aparte bestanden of databasetabellen
Pandas-joins voor spreadsheetgebruikers

Voorbeeld: aanvullende data

$$ Aanvullende data

Pandas-joins voor spreadsheetgebruikers

Voorbeeld: aanvullende data

$$ Kolommen met aanvullende data

Pandas-joins voor spreadsheetgebruikers

Voorbeeld: aanvullende data

$$ Rijen met aanvullende data

Pandas-joins voor spreadsheetgebruikers

Laten we oefenen!

Pandas-joins voor spreadsheetgebruikers

Preparing Video For Download...