Uniform Manifold Approximation and Projection (UMAP)

Riduzione della dimensionalità in R

Matt Pickard

Owner, Pickard Predictives, LLC

PCA, t-SNE e UMAP

Confronto tra PCA, t-SNE e UMAP

Riduzione della dimensionalità in R

PCA, t-SNE e UMAP

Confronto tra PCA, t-SNE e UMAP

Riduzione della dimensionalità in R

PCA, t-SNE e UMAP

Confronto tra PCA, t-SNE e UMAP

Riduzione della dimensionalità in R

PCA, t-SNE e UMAP

Confronto tra PCA, t-SNE e UMAP

Riduzione della dimensionalità in R

PCA, t-SNE e UMAP

Confronto tra PCA, t-SNE e UMAP

UMAP ha iperparametri simili che si possono ottimizzare.

Riduzione della dimensionalità in R

Grafico UMAP

library(embed)

set.seed(1234) umap_df <- recipe(Attrition ~ ., data = attrition_df) %>% step_normalize(all_predictors()) %>% step_umap(all_predictors(), num_comp = 2) %>% prep() %>% juice()
umap_df %>% ggplot(aes(x = UMAP1, y = UMAP2, color = Attrition)) + geom_point(alpha = 0.7)
Riduzione della dimensionalità in R

UMAP: abbandono dei dipendenti

Grafico UMAP dell'abbandono dei dipendenti

Riduzione della dimensionalità in R

UMAP in tidymodels

Crea la ricetta

umap_recipe <-  recipe(Attrition ~ ., data = train) %>% 
  step_normalize(all_predictors()) %>% 
  step_umap(all_predictors(), num_comp = 4)

Crea la specifica del modello

umap_lr_model <- linear_reg()
Riduzione della dimensionalità in R

UMAP in tidymodels

Crea il workflow

umap_lr_workflow <-  workflow() %>% 
  add_recipe(umap_recipe) %>% 
  add_model(umap_lr_model)

Allena il workflow

umap_lr_fit <- umap_lr_workflow %>% 
  fit(data = train)
Riduzione della dimensionalità in R

UMAP in tidymodels

Valuta il modello

predict_umap_df <- test %>% 
  bind_cols(predict = predict(umap_lr_fit, test))

rmse(predict_umap_df, Attrition, .pred_class)
Riduzione della dimensionalità in R

Passons à la pratique !

Riduzione della dimensionalità in R

Preparing Video For Download...