Kenmerkenselectie vs. -extractie

Dimensionality Reduction in Python

Jeroen Boeye

Head of Machine Learning, Faktion

Waarom dimensionaliteit verlagen?

 

Je dataset zal:
  • minder complex zijn
  • minder schijfruimte vragen
  • minder rekentijd kosten
  • minder kans op overfitting hebben
Dimensionality Reduction in Python

Kenmerkenselectie

inkomen leeftijd lievelingskleur

Dimensionality Reduction in Python

Kenmerkenselectie

verwijderd kenmerk

insurance_df.drop('favorite color', axis=1)
Dimensionality Reduction in Python

Een pairplot maken met ANSUR-gegevens

sns.pairplot(ansur_df, hue="gender", diag_kind='hist')

lichaam pairplot

Dimensionality Reduction in Python

Een pairplot maken met ANSUR-gegevens

sns.pairplot(ansur_df, hue="gender", diag_kind='hist')

lichaam pairplot geannoteerd

Dimensionality Reduction in Python

Een pairplot maken met ANSUR-gegevens

sns.pairplot(ansur_df, hue="gender", diag_kind='hist')

constante pairplot

Dimensionality Reduction in Python

Kenmerkenselectie

Schema kenmerkenselectie

Dimensionality Reduction in Python

Kenmerkenselectie

Schema kenmerkenselectie

Kenmerkenextractie

Schema kenmerkenextractie

Dimensionality Reduction in Python

Kenmerkenextractie - voorbeeld

4 vs. 4 pairplot

Dimensionality Reduction in Python

Kenmerkenextractie - voorbeeld

pairplot pca transformatie

Dimensionality Reduction in Python

Laten we oefenen!

Dimensionality Reduction in Python

Preparing Video For Download...