t-Distributed Stochastic Neighborhood Embedding (t-SNE)

Riduzione della dimensionalità in R

Matt Pickard

Owner, Pickard Predictives, LLC

Tabella t-SNE vs PCA

Riduzione della dimensionalità in R

Tabella t-SNE vs PCA

Riduzione della dimensionalità in R

Tabella t-SNE vs PCA

Riduzione della dimensionalità in R

Tabella t-SNE vs PCA

Riduzione della dimensionalità in R

Tabella t-SNE vs PCA

Riduzione della dimensionalità in R

Grafici PCA e t-SNE

PCA

Grafico PCA

Preserva la struttura globale

t-SNE

Grafico t-SNE

Preserva la struttura locale (mantiene vicini i punti vicini)

Riduzione della dimensionalità in R

Iperparametri di t-SNE

  • Perplexity - numero di vicini considerati
  • Learning rate - velocità di aggiornamento dei pesi
  • Iterations - numero di iterazioni di backpropagation

t-SNE

Grafico t-SNE

Riduzione della dimensionalità in R

t-SNE in R

library(Rtsne)

set.seed(1234) tsne <- Rtsne(attrition_df %>% select(-Attrition))
tsne_df <- attrition_df %>% bind_cols(tsne_x = tsne$Y[,1], tsne_y = tsne$Y[,2])
tsne_df %>% ggplot(aes(x = tsne_x, y = tsne_y, color = Attrition)) + geom_point(alpha = 0.5)
Riduzione della dimensionalità in R

Grafico t-SNE

Grafico t-SNE

Riduzione della dimensionalità in R

Passiamo alla pratica!

Riduzione della dimensionalità in R

Preparing Video For Download...