Clusterizzazione semplice di parole

Text mining con Bag-of-Words in R

Ted Kwartler

Instructor

Esempio di clustering gerarchico

dist_rain <- dist(rain[, 2])

Esempio di clustering gerarchico

Text mining con Bag-of-Words in R

Un semplice dendrogramma

# Converti in oggetto di clustering gerarchico
hc <- hclust(dist_rain)

# Disegna il dendrogramma con etichette città plot(hc, labels = rain$city)

dendrogramma_clust.png

Text mining con Bag-of-Words in R

Estetica del dendrogramma

# Carica il pacchetto dendextend
library(dendextend)

# Converti la matrice delle distanze in dendrogramma hc <- hclust(tweets_dist) hcd <- as.dendrogram(hc)
# Colora i rami
hcd <- branches_attr_by_labels(hcd, 
           c("marvin", "gaye"), "red")

# Disegna il dendrogramma con alcune estetiche plot(hcd, main = "Better Dendrogram") rect.dendrogram(hcd, k = 2, border = "grey50")

dendrogramma_aestetica.png

Text mining con Bag-of-Words in R

Passiamo alla pratica!

Text mining con Bag-of-Words in R

Preparing Video For Download...