Dimensiereductie: feature-extractie

Machine Learning-sollicitatievragen oefenen in Python

Lisa Stuart

Data Scientist

Unsupervised learning-methoden

  • Principal component analysis (PCA) --> Les 3.1
  • Singular value decomposition (SVD) --> Les 3.1
  • Clustering/groeperen --> Les 3.3
  • Verkennende datamining
Machine Learning-sollicitatievragen oefenen in Python

Dimensiereductie != featureselectie

PCA-plot

Featureselectie

1 https://slideplayer.com/slide/9699240/ 2 https://www.analyticsvidhya.com/blog/2016/03/practical-guide-principal-component-analysis-python/
Machine Learning-sollicitatievragen oefenen in Python

Vloek van dimensionaliteit

Dimensionaliteit vs. prestatie-plot

1 https://www.visiondummy.com/2014/04/curse-dimensionality-affect-classification/
Machine Learning-sollicitatievragen oefenen in Python

1D-zoekopdracht

1D-zoekruimte

Machine Learning-sollicitatievragen oefenen in Python

2D-zoekopdracht

2D-zoekruimte

Machine Learning-sollicitatievragen oefenen in Python

3D-zoekopdracht

3D-zoekruimte

Machine Learning-sollicitatievragen oefenen in Python

Methoden voor dimensiereductie

  • PCA
  • SVD
Machine Learning-sollicitatievragen oefenen in Python

PCA

Iris PCA-plot

  • PCA
    • Relatie tussen X en y
    • Bepaalt hoofdassen
    • Vertaalt, roteert en schaalt
    • Laagdimensionale projectie van de data
1 https://scikit-learn.org/stable/modules/decomposition.html
Machine Learning-sollicitatievragen oefenen in Python

SVD

Iris SVD-plot

  • SVD
    • Lineaire algebra en vectorrekening
    • Decomponeert datamatrix in drie matrices
    • Levert 'singuliere' waarden op
    • Variantie ≈ som van kwadraten van singuliere waarden
1 https://galaxydatatech.com/2018/07/15/singular-value-decomposition/
Machine Learning-sollicitatievragen oefenen in Python

Functies voor dimensiereductie

Functie/methode retourneert
sklearn.decomposition.PCA principal component analysis
sklearn.decomposition.TruncatedSVD singular value decomposition
PCA/SVD.fit_transform(X) fit en transformeer data
PCA/SVD.explained_variance_ratio_ verklaarde variantie door PC's
Machine Learning-sollicitatievragen oefenen in Python

Laten we oefenen!

Machine Learning-sollicitatievragen oefenen in Python

Preparing Video For Download...