Categorieën herschikken

Werken met categorische data in Python

Kasey Jones

Research data scientist

Waarom herschikken?

  1. Een ordinale variabele maken
  2. De weergavevolgorde in analyses bepalen
  3. Geheugen besparen
Werken met categorische data in Python

Voorbeeld herschikken

dogs['coat'] = dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'wirehaired', 'long'],

ordered=True )

Inplace gebruiken:

dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'wirehaired', 'long'],
  ordered=True,

inplace=True )
Werken met categorische data in Python

Groeperen bij ordered=True

dogs['coat'] = dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'wirehaired', 'long'],
  ordered=True
)
dogs.groupby(by=['coat'])['age'].mean()
coat
short         8.364746
medium        9.027982
wirehaired    8.424136
long          9.552056
Werken met categorische data in Python

Groeperen bij ordered=False

dogs['coat'] = dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'long', 'wirehaired'],

ordered=False )
dogs.groupby(by=['coat'])['age'].mean()
coat
short         8.364746
medium        9.027982
long          9.552056
wirehaired    8.424136
Werken met categorische data in Python

Oefenen met herschikken

Werken met categorische data in Python

Preparing Video For Download...