Numerieke variabelen

Feature engineering voor Machine Learning in Python

Robert O'Callaghan

Director of Data Science, Ordergroove

Types numerieke features

  • Leeftijd
  • Prijs
  • Aantallen
  • Geografische data
Feature engineering voor Machine Learning in Python

Maakt grootte uit?

Feature engineering voor Machine Learning in Python

Numerieke variabelen binariseren

df['Binary_Violation'] = 0

df.loc[df['Number_of_Violations'] > 0, 'Binary_Violation'] = 1
Feature engineering voor Machine Learning in Python

Numerieke variabelen binariseren

Feature engineering voor Machine Learning in Python

Numerieke variabelen indelen in bins

import numpy as np
df['Binned_Group'] = pd.cut(
    df['Number_of_Violations'], 
    bins=[-np.inf, 0, 2, np.inf],
    labels=[1, 2, 3]
)
Feature engineering voor Machine Learning in Python

Numerieke variabelen indelen in bins

Feature engineering voor Machine Learning in Python

Laten we oefenen!

Feature engineering voor Machine Learning in Python

Preparing Video For Download...