Feature selection vs. feature extraction

Riduzione della dimensionalità in Python

Jeroen Boeye

Head of Machine Learning, Faktion

Why reduce dimensionality?

 

Your dataset will:
  • be less complex
  • require less disk space
  • require less computation time
  • have lower chance of model overfitting
Riduzione della dimensionalità in Python

Feature selection

income age favorite color

Riduzione della dimensionalità in Python

Feature selection

removed feature

insurance_df.drop('favorite color', axis=1)
Riduzione della dimensionalità in Python

Building a pairplot on ANSUR data

sns.pairplot(ansur_df, hue="gender", diag_kind='hist')

body pairplot

Riduzione della dimensionalità in Python

Building a pairplot on ANSUR data

sns.pairplot(ansur_df, hue="gender", diag_kind='hist')

body pairplot annotated

Riduzione della dimensionalità in Python

Building a pairplot on ANSUR data

sns.pairplot(ansur_df, hue="gender", diag_kind='hist')

constant pairplot

Riduzione della dimensionalità in Python

Feature selection

Feature selection schema

Riduzione della dimensionalità in Python

Feature selection

Feature selection schema

Feature extraction

Feature extraction schema

Riduzione della dimensionalità in Python

Feature extraction - Example

4 vs. 4 pairplot

Riduzione della dimensionalità in Python

Feature extraction - Example

pairplot pca transform

Riduzione della dimensionalità in Python

Let's practice!

Riduzione della dimensionalità in Python

Preparing Video For Download...