Feature engineering

MLOps-concepten

Folkert Stijnman

ML Engineer

Feature engineering

MLOps-fasen feature engineering

MLOps-concepten

Feature engineering

... is het proces van het selecteren, bewerken en transformeren van ruwe data naar features.

  • Een feature is een variabele, zoals een kolom in een tabel
  • We kunnen ruwe data gebruiken, maar ook zelf features maken
MLOps-concepten

Klantdata

Voorbeeld klantdata

MLOps-concepten

Klantdata

Voorbeeld klantdata met nieuwe feature

MLOps-concepten

Feature engineering

  • Doel: betere modelprestatie
  • Tools en technieken om features te verwerken, selecteren en beheren:
    • Featureselectie
    • Feature store
    • Data version control
MLOps-concepten

Featureselectie

  • Domeinspecifieke kennis
  • Correlatie
  • Feature-importance
  • Andere methoden: univariate selectie, Principal Component Analysis (PCA), Recursive Feature Elimination (RFE)

correlatieplot

1 https://www.datacamp.com/tutorial/tutorial-datails-on-correlation
MLOps-concepten

De feature store

Feature store

Alleen relevant voor grote teams die meerdere projecten met dezelfde features doen

MLOps-concepten

Data version control

  • Wijzigingen in datasets bijhouden
  • Consistentie bewaren door de hele ontwikkelcyclus

grafiek met data version control en git

1 https://www.datacamp.com/courses/cicd-for-machine-learning
MLOps-concepten

Laten we oefenen!

MLOps-concepten

Preparing Video For Download...