Visualiseer populaire termen

Socialemediagegevens analyseren in R

Vivek Vijayaraghavan

Data Science Coach

Lesoverzicht

  • Haal de meest frequente termen uit het tekstcorpus
  • Verwijder aangepaste stopwoorden en verfijn het corpus
  • Visualiseer populaire termen met staafdiagram en wordcloud
Socialemediagegevens analyseren in R

Termfrequentie

  • Haal termfrequentie op: het aantal keer dat elk woord voorkomt
# Extract term frequency
library(qdap)
term_count  <-  freq_terms(twt_corpus_final, 60)
term_count
Socialemediagegevens analyseren in R

Termfrequentie

Termfrequentie

Socialemediagegevens analyseren in R

Aangepaste stopwoorden verwijderen

# Create a vector of custom stop words
custom_stop <- c("obesity", "can", "amp", "one", "like", "will", "just", 
                "many", "new", "know", "also", "need", "may", "now", 
                "get", "s", "t", "m", "re")
# Remove custom stop words
twt_corpus_refined <- tm_map(twt_corpus_final,removeWords, custom_stop)
Socialemediagegevens analyseren in R

Termtelling na verfijnen van corpus

# Term count after refining corpus
term_count_clean <- freq_terms(twt_corpus_refined, 20)
term_count_clean
Socialemediagegevens analyseren in R

Termfrequentie na verfijnen van corpus

Termfrequentie na verfijnen van corpus

  • Een merk dat een obesitasprogramma promoot kan deze termen analyseren
Socialemediagegevens analyseren in R

Staafdiagram van populaire termen

  • Maak een staafdiagram van termen die > 50 keer voorkomen
  • Staafdiagrammen vatten populaire termen helder samen
# Create a subset dataframe
term50 <- subset(term_count_clean, FREQ > 50)
Socialemediagegevens analyseren in R

Staafdiagram van meest populaire termen

library(ggplot2)
# Create a bar plot of frequent terms
ggplot(term50, aes(x = reorder(WORD,  -FREQ),  y = FREQ)) +
       geom_bar(stat = "identity", fill = "blue") + 
       theme(axis.text.x = element_text(angle = 45, hjust = 1))
Socialemediagegevens analyseren in R

Staafdiagram van populaire termen

Staafdiagram van populaire termen

Socialemediagegevens analyseren in R

Wordcloud

  • Visualiseer frequente termen met wordclouds
  • Een wordcloud is een afbeelding van woorden
  • Woordgrootte geeft frequentie aan
  • Effectief promotiemiddel voor campagnes
  • Brengt de boodschap over en benadrukt populaire termen
Socialemediagegevens analyseren in R

Wordcloud op basis van min. frequentie

  • De functie wordcloud() maakt wordclouds
# Create a word cloud based on min frequency
library(wordcloud)
wordcloud(twt_corpus_refined, min.freq = 20, colors = "red", 
          scale = c(3,0.5), random.order = FALSE)
Socialemediagegevens analyseren in R

Wordcloud op basis van min. frequentie

Wordcloud op basis van minimale frequentie

Socialemediagegevens analyseren in R

Kleurrijke wordcloud

# Create a colorful word cloud
library(RColorBrewer)
wordcloud(twt_corpus_refined, max.words = 100, 
          colors = brewer.pal(6,"Dark2"), scale = c(2.5,.5),
          random.order = FALSE)
Socialemediagegevens analyseren in R

Kleurrijke wordcloud

Wordcloud met verschillende kleuren

Socialemediagegevens analyseren in R

Laten we oefenen!

Socialemediagegevens analyseren in R

Preparing Video For Download...