Clustering

Statistische technieken in Tableau

Maarten Van den Broeck

Content Developer at DataCamp

Supervised vs. unsupervised machine learning

Supervised learning

  • Pas bekende relaties tussen variabelen toe op nieuwe, ongeziene data
  • Bijv. regressie, exponentiële smoothing

Unsupervised learning

  • Zoekt vergelijkbare punten en ontdekt patronen
  • Bijv. clustering
Statistische technieken in Tableau

k-means-clustering

Visuele weergave van het k-means-clusteralgoritme.

Statistische technieken in Tableau

k-means-clustering

Visuele weergave van het k-means-clusteralgoritme. Twee willekeurige centra worden gekozen.

Statistische technieken in Tableau

k-means-clustering

Visuele weergave van het k-means-clusteralgoritme. De dichtstbijzijnde punten worden aan die centra toegewezen.

Statistische technieken in Tableau

k-means-clustering

Visuele weergave van het k-means-clusteralgoritme. De centra worden verplaatst naar het nieuwe middelpunt.

Statistische technieken in Tableau

k-means-clustering

Visuele weergave van het k-means-clusteralgoritme. Het proces is iteratief en herhaalt.

Statistische technieken in Tableau

k-means-clustering

Visuele weergave van het k-means-clusteralgoritme. Het algoritme stopt wanneer de centra niet meer bewegen.

Statistische technieken in Tableau

Clusterkwaliteit beoordelen

Tussen-groepen som van kwadraten

Visuele weergave van k-means-clustering. Tussen-groepen som van kwadraten is de som van de gekwadrateerde afstanden tussen de centra en het gemiddelde van de hele dataset.

  • Hoe hoger, hoe beter

Binnen-groepen som van kwadraten

Visuele weergave van k-means-clustering. Binnen-groepen som van kwadraten is de som van de gekwadrateerde afstanden tussen de centra en de punten van de cluster.

  • Hoe lager, hoe beter
Statistische technieken in Tableau

Laten we oefenen!

Statistische technieken in Tableau

Preparing Video For Download...