Feature Engineering

MLOps-Konzepte

Folkert Stijnman

ML Engineer

Feature Engineering

MLOps phases feature engineering

MLOps-Konzepte

Feature Engineering

... beschreibt den Prozess, bei dem Rohdaten ausgewählt, aufbereitet und in Merkmale, also Features, umgewandelt werden.

  • Ein Merkmal ist eine Variable, zum Beispiel die Spalte in einer Tabelle.
  • Wir können Rohdaten nutzen, aber auch unsere eigenen erstellen.
MLOps-Konzepte

Kundendaten

Example customer data

MLOps-Konzepte

Kundendaten

Example customer data with new feature

MLOps-Konzepte

Feature Engineering

  • Ziel: Verbesserung der Modellleistung
  • Tools und Techniken helfen dabei, Merkmale zu bearbeiten, auszuwählen und zu pflegen:
    • Feature Selection
    • Feature Store
    • Data Version Control
MLOps-Konzepte

Merkmalauswahl

  • Fachwissen
  • Korrelation
  • Wichtigkeit der Merkmale
  • Andere Methoden: univariate Auswahl, Principal Component Analysis (PCA), Recursive Feature Elimination (RFE)

correlation plot

1 https://www.datacamp.com/tutorial/tutorial-datails-on-correlation
MLOps-Konzepte

Feature Store

Feature store

Nur wichtig für große Teams, die an mehreren Projekten arbeiten, die die gleichen Merkmale nutzen.

MLOps-Konzepte

Data Version Control

  • Verfolgen von Änderungen an Datensätzen
  • Wahren von Einheitlichkeit im ganzen Entwicklungszyklus

graphic depicting data version control and git

1 https://www.datacamp.com/courses/cicd-for-machine-learning
MLOps-Konzepte

Lass uns üben!

MLOps-Konzepte

Preparing Video For Download...