Introductie tot hiërarchisch clusteren

Unsupervised learning in R

Hank Roark

Senior Data Scientist at Boeing

Hiërarchisch clusteren

  • Aantal clusters is vooraf onbekend
  • Twee soorten: bottom-up en top-down; in deze cursus bottom-up
Unsupervised learning in R

Eenvoudig voorbeeld

vijf punten

Unsupervised learning in R

Vijf clusters

elk punt is een cluster

Unsupervised learning in R

Vier clusters

vier clusters, één cluster met twee punten

Unsupervised learning in R

Drie clusters

drie clusters: twee met twee punten en één met één punt

Unsupervised learning in R

Twee clusters

twee clusters, één cluster met 3 punten en één met 2 punten

Unsupervised learning in R

Eén cluster

één cluster met alle punten

Unsupervised learning in R

Hiërarchisch clusteren in R

# Calculates similarity as Euclidean distance 
# between observations
dist_matrix <- dist(x)

# Returns hierarchical clustering model hclust(d = dist_matrix)
Call:
hclust(d = s)

Cluster method   : complete 
Distance         : euclidean 
Number of objects: 50
Unsupervised learning in R

Laten we oefenen!

Unsupervised learning in R

Preparing Video For Download...