Clustering

Tecniche statistiche in Tableau

Maarten Van den Broeck

Content Developer at DataCamp

Supervisionato vs non supervisionato

Apprendimento supervisionato

  • Applica relazioni note tra variabili a nuovi dati non visti
  • Es. regressione, smoothing esponenziale

Apprendimento non supervisionato

  • Cerca punti simili e rileva pattern
  • Es. clustering
Tecniche statistiche in Tableau

Clustering k-means

Rappresentazione visiva dell'algoritmo k-means.

Tecniche statistiche in Tableau

Clustering k-means

Rappresentazione visiva dell'algoritmo k-means. Si selezionano due centri casuali.

Tecniche statistiche in Tableau

Clustering k-means

Rappresentazione visiva dell'algoritmo k-means. I punti più vicini sono assegnati a questi centri.

Tecniche statistiche in Tableau

Clustering k-means

Rappresentazione visiva dell'algoritmo k-means. I centri vengono spostati al nuovo centro.

Tecniche statistiche in Tableau

Clustering k-means

Rappresentazione visiva dell'algoritmo k-means. Il processo è iterativo e si ripete.

Tecniche statistiche in Tableau

Clustering k-means

Rappresentazione visiva dell'algoritmo k-means. L'algoritmo si ferma quando i centri non si muovono più.

Tecniche statistiche in Tableau

Valutare la qualità del clustering

Somma dei quadrati tra gruppi

Rappresentazione visiva del clustering k-means. La somma dei quadrati tra gruppi è la somma delle distanze al quadrato tra i centri e la media dell'intero dataset.

  • Più alta, meglio è

Somma dei quadrati entro gruppo

Rappresentazione visiva del clustering k-means. La somma dei quadrati entro gruppo è la somma delle distanze al quadrato tra i centri e i punti del cluster.

  • Più bassa, meglio è
Tecniche statistiche in Tableau

Let's practice!

Tecniche statistiche in Tableau

Preparing Video For Download...