Ingénierie des caractéristiques

Concepts MLOps

Folkert Stijnman

ML Engineer

Ingénierie des caractéristiques

MLOps phases feature engineering

Concepts MLOps

Ingénierie des caractéristiques

... est le processus qui consiste à sélectionner, manipuler et transformer des données brutes en caractéristiques.

  • Une fonctionnalité est une variable, telle que la colonne d'une table
  • Nous pouvons utiliser des données brutes, mais également créer les nôtres
Concepts MLOps

Données sur les clients

Example customer data

Concepts MLOps

Données sur les clients

Example customer data with new feature

Concepts MLOps

Ingénierie des caractéristiques

  • L'objectif est d'améliorer les performances du modèle
  • Les outils et techniques facilitent le traitement, la sélection et la maintenance des fonctionnalités :
    • Sélection des caractéristiques
    • Magasin de fonctionnalités
    • Contrôle de version des données
Concepts MLOps

Sélection des caractéristiques

  • Connaissances spécifiques à un domaine
  • Corrélation
  • Importance des caractéristiques
  • Autres méthodes : sélection univariée, analyse en composantes principales (PCA), élimination récursive des caractéristiques (RFE)

correlation plot

1 https://www.datacamp.com/tutorial/tutorial-datails-on-correlation
Concepts MLOps

Le magasin de fonctionnalités

Feature store

Applicable uniquement aux grandes équipes travaillant sur plusieurs projets qui utilisent les mêmes fonctionnalités

Concepts MLOps

Contrôle de version des données

  • Suivi des modifications apportées aux ensembles de données
  • Maintenir la cohérence tout au long du cycle de développement

graphic depicting data version control and git

1 https://www.datacamp.com/courses/cicd-for-machine-learning
Concepts MLOps

Passons à la pratique !

Concepts MLOps

Preparing Video For Download...