Aantal clusters kiezen

Unsupervised learning in R

Hank Roark

Senior Data Scientist at Boeing

Resultaten interpreteren

# Create hierarchical cluster model: hclust.out
hclust.out <- hclust(dist(x))

# Inspect the result summary(hclust.out)
            Length Class  Mode     
merge       98     -none- numeric  
height      49     -none- numeric  
order       50     -none- numeric  
labels       0     -none- NULL     
method       1     -none- character
call         2     -none- call     
dist.method  1     -none- character
Unsupervised learning in R

Dendrogram

  • Boomstructuur om hiërarchische clustering te interpreteren

vijf observaties geplot en een dendrogram

Unsupervised learning in R

Dendrogram

  • Boomstructuur om hiërarchische clustering te interpreteren

twee clusterpunten worden samengevoegd in het dendrogram

Unsupervised learning in R

Dendrogram

  • Boomstructuur om hiërarchische clustering te interpreteren

twee andere clusterpunten worden samengevoegd in het dendrogram

Unsupervised learning in R

Dendrogram

  • Boomstructuur om hiërarchische clustering te interpreteren

twee clusters en een punt worden samengevoegd in het dendrogram

Unsupervised learning in R

Dendrogram

  • Boomstructuur om hiërarchische clustering te interpreteren

alle clusters en punten worden samengevoegd in het dendrogram

Unsupervised learning in R

Dendrogram plotten in R

# Draws a dendrogram
plot(hclust.out)

abline(h = 6, col = "red")

horizontale lijn die aangeeft hoeveel clusters we willen in het dendrogram

Unsupervised learning in R

Boom "knippen" in R

# Knip op hoogte h
cutree(hclust.out, h = 6)
1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 3 3
3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 2 4 2 4 4
# Knip op aantal clusters k
cutree(hclust.out, k = 2)
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1
Unsupervised learning in R

Laten we oefenen!

Unsupervised learning in R

Preparing Video For Download...