Réordonner les catégories

Utilisation de données catégorielles dans Python

Kasey Jones

Research data scientist

Pourquoi réordonner ?

  1. Créer une variable ordinale
  2. Définir l’ordre d’affichage en analyse
  3. Gains de mémoire
Utilisation de données catégorielles dans Python

Exemple de réordonnancement

dogs['coat'] = dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'wirehaired', 'long'],

ordered=True )

Avec inplace :

dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'wirehaired', 'long'],
  ordered=True,

inplace=True )
Utilisation de données catégorielles dans Python

Groupement avec ordered=True

dogs['coat'] = dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'wirehaired', 'long'],
  ordered=True
)
dogs.groupby(by=['coat'])['age'].mean()
coat
short         8.364746
medium        9.027982
wirehaired    8.424136
long          9.552056
Utilisation de données catégorielles dans Python

Groupement avec ordered=False

dogs['coat'] = dogs["coat"].cat.reorder_categories(
  new_categories = ['short', 'medium', 'long', 'wirehaired'],

ordered=False )
dogs.groupby(by=['coat'])['age'].mean()
coat
short         8.364746
medium        9.027982
long          9.552056
wirehaired    8.424136
Utilisation de données catégorielles dans Python

Exercice de réordonnancement

Utilisation de données catégorielles dans Python

Preparing Video For Download...