Popüler terimleri görselleştirme

R ile Sosyal Medya Verilerini Analiz Etme

Vivek Vijayaraghavan

Data Science Coach

Ders özeti

  • Metin korpusundan en sık terimleri çıkarın
  • Özel durak (stop) kelimeleri kaldırıp korpusu arındırın
  • Popüler terimleri çubuk grafik ve kelime bulutuyla görselleştirin
R ile Sosyal Medya Verilerini Analiz Etme

Terim sıklığı

  • Terim sıklığını çıkarın: her kelimenin geçiş sayısı
# Extract term frequency
library(qdap)
term_count  <-  freq_terms(twt_corpus_final, 60)
term_count
R ile Sosyal Medya Verilerini Analiz Etme

Terim sıklığı

Terim sıklığı

R ile Sosyal Medya Verilerini Analiz Etme

Özel stop kelimelerin kaldırılması

# Create a vector of custom stop words
custom_stop <- c("obesity", "can", "amp", "one", "like", "will", "just", 
                "many", "new", "know", "also", "need", "may", "now", 
                "get", "s", "t", "m", "re")
# Remove custom stop words
twt_corpus_refined <- tm_map(twt_corpus_final,removeWords, custom_stop)
R ile Sosyal Medya Verilerini Analiz Etme

Korpus arındırıldıktan sonra terim sayımı

# Term count after refining corpus
term_count_clean <- freq_terms(twt_corpus_refined, 20)
term_count_clean
R ile Sosyal Medya Verilerini Analiz Etme

Korpus arındırıldıktan sonra terim sıklığı

Korpus arındırıldıktan sonra terim sıklığı

  • Obezite yönetimi programı tanıtan bir marka bu terimleri analiz edebilir
R ile Sosyal Medya Verilerini Analiz Etme

Popüler terimlerin çubuk grafiği

  • 50’den fazla geçen terimlerin çubuk grafiğini oluşturun
  • Çubuk grafikler popüler terimleri kolay okunur özetler
# Create a subset dataframe
term50 <- subset(term_count_clean, FREQ > 50)
R ile Sosyal Medya Verilerini Analiz Etme

En popüler terimlerin çubuk grafiği

library(ggplot2)
# Create a bar plot of frequent terms
ggplot(term50, aes(x = reorder(WORD,  -FREQ),  y = FREQ)) +
       geom_bar(stat = "identity", fill = "blue") + 
       theme(axis.text.x = element_text(angle = 45, hjust = 1))
R ile Sosyal Medya Verilerini Analiz Etme

Popüler terimlerin çubuk grafiği

Popüler terimlerin çubuk grafiği

R ile Sosyal Medya Verilerini Analiz Etme

Kelime bulutu

  • Sık terimleri kelime bulutlarıyla görselleştirin
  • Kelime bulutu kelimelerden oluşan bir görseldir
  • Kelime boyutu sıklığı gösterir
  • Kampanyalar için etkili bir görseldir
  • Marka mesajını iletir ve popüler terimleri öne çıkarır
R ile Sosyal Medya Verilerini Analiz Etme

Asgari sıklığa dayalı kelime bulutu

  • wordcloud() işlevi kelime bulutları oluşturur
# Create a word cloud based on min frequency
library(wordcloud)
wordcloud(twt_corpus_refined, min.freq = 20, colors = "red", 
          scale = c(3,0.5), random.order = FALSE)
R ile Sosyal Medya Verilerini Analiz Etme

Asgari sıklığa dayalı kelime bulutu

Asgari sıklığa dayalı kelime bulutu

R ile Sosyal Medya Verilerini Analiz Etme

Renkli kelime bulutu

# Create a colorful word cloud
library(RColorBrewer)
wordcloud(twt_corpus_refined, max.words = 100, 
          colors = brewer.pal(6,"Dark2"), scale = c(2.5,.5),
          random.order = FALSE)
R ile Sosyal Medya Verilerini Analiz Etme

Renkli kelime bulutu

Farklı renklerde kelime bulutu

R ile Sosyal Medya Verilerini Analiz Etme

Hadi pratik yapalım!

R ile Sosyal Medya Verilerini Analiz Etme

Preparing Video For Download...