Visualisasikan istilah populer

Menganalisis Data Media Sosial dengan R

Vivek Vijayaraghavan

Data Science Coach

Ikhtisar pelajaran

  • Ekstrak istilah terfrekuensi dari korpus teks
  • Hapus stop word kustom dan perhalus korpus
  • Visualisasikan istilah populer dengan bagan batang dan word cloud
Menganalisis Data Media Sosial dengan R

Frekuensi istilah

  • Ekstrak frekuensi istilah, yaitu jumlah kemunculan tiap kata
# Extract term frequency
library(qdap)
term_count  <-  freq_terms(twt_corpus_final, 60)
term_count
Menganalisis Data Media Sosial dengan R

Frekuensi istilah

Frekuensi istilah

Menganalisis Data Media Sosial dengan R

Menghapus stop word kustom

# Create a vector of custom stop words
custom_stop <- c("obesity", "can", "amp", "one", "like", "will", "just", 
                "many", "new", "know", "also", "need", "may", "now", 
                "get", "s", "t", "m", "re")
# Remove custom stop words
twt_corpus_refined <- tm_map(twt_corpus_final,removeWords, custom_stop)
Menganalisis Data Media Sosial dengan R

Jumlah istilah setelah pemurnian korpus

# Term count after refining corpus
term_count_clean <- freq_terms(twt_corpus_refined, 20)
term_count_clean
Menganalisis Data Media Sosial dengan R

Frekuensi istilah setelah pemurnian korpus

Frekuensi istilah setelah pemurnian korpus

  • Merek yang mempromosikan program manajemen obesitas dapat menganalisis istilah ini
Menganalisis Data Media Sosial dengan R

Bagan batang istilah populer

  • Buat bagan batang untuk istilah yang muncul > 50 kali
  • Bagan batang merangkum istilah populer secara mudah dibaca
# Create a subset dataframe
term50 <- subset(term_count_clean, FREQ > 50)
Menganalisis Data Media Sosial dengan R

Bagan batang istilah terpopuler

library(ggplot2)
# Create a bar plot of frequent terms
ggplot(term50, aes(x = reorder(WORD,  -FREQ),  y = FREQ)) +
       geom_bar(stat = "identity", fill = "blue") + 
       theme(axis.text.x = element_text(angle = 45, hjust = 1))
Menganalisis Data Media Sosial dengan R

Bagan batang istilah populer

Bagan batang istilah populer

Menganalisis Data Media Sosial dengan R

Word cloud

  • Visualisasikan istilah sering dengan word cloud
  • Word cloud adalah gambar yang tersusun dari kata
  • Ukuran kata menunjukkan frekuensi
  • Gambar promosi yang efektif untuk kampanye
  • Menyampaikan pesan merek dan menyorot istilah populer
Menganalisis Data Media Sosial dengan R

Word cloud berbasis frekuensi minimum

  • Fungsi wordcloud() membantu membuat word cloud
# Create a word cloud based on min frequency
library(wordcloud)
wordcloud(twt_corpus_refined, min.freq = 20, colors = "red", 
          scale = c(3,0.5), random.order = FALSE)
Menganalisis Data Media Sosial dengan R

Word cloud berbasis frekuensi minimum

Word cloud berbasis frekuensi minimum

Menganalisis Data Media Sosial dengan R

Word cloud berwarna

# Create a colorful word cloud
library(RColorBrewer)
wordcloud(twt_corpus_refined, max.words = 100, 
          colors = brewer.pal(6,"Dark2"), scale = c(2.5,.5),
          random.order = FALSE)
Menganalisis Data Media Sosial dengan R

Word cloud berwarna

Word cloud dengan berbagai warna

Menganalisis Data Media Sosial dengan R

Ayo berlatih!

Menganalisis Data Media Sosial dengan R

Preparing Video For Download...