Eenvoudige woordclustering

Text mining met bag-of-words in R

Ted Kwartler

Instructor

Voorbeeld van hiërarchisch clusteren

dist_rain <- dist(rain[, 2])

Voorbeeld hiërarchische clustering

Text mining met bag-of-words in R

Een simpel dendrogram

# Convert to hierarchical cluster obj
hc <- hclust(dist_rain)

# Plot dendrogram with city labels plot(hc, labels = rain$city)

Clusterdendrogram

Text mining met bag-of-words in R

Opmaak van dendrogrammen

# Load dendextend package
library(dendextend)

# Convert distance matrix to dendrogram hc <- hclust(tweets_dist) hcd <- as.dendrogram(hc)
# Color branches
hcd <- branches_attr_by_labels(hcd, 
           c("marvin", "gaye"), "red")

# Plot dendrogram with some aesthetics plot(hcd, main = "Better Dendrogram") rect.dendrogram(hcd, k = 2, border = "grey50")

Dendrogram met opmaak

Text mining met bag-of-words in R

Laten we oefenen!

Text mining met bag-of-words in R

Preparing Video For Download...