Menjalankan topic modeling

Pengantar Analisis Teks di R

Maham Faisal Khan

Senior Data Science Content Developer

Menggunakan LDA()

library(topicmodels)

lda_out <- LDA( dtm_review, k = 2, method = "Gibbs", control = list(seed = 42) )
Pengantar Analisis Teks di R

Keluaran LDA()

lda_out
Model topik LDA_Gibbs dengan 2 topik.
Pengantar Analisis Teks di R

Menggunakan glimpse()

glimpse(lda_out)
Kelas formal 'LDA_Gibbs' [paket "topicmodels"] dengan 16 slot
  ..@ seedwords      : NULL
  ..@ z              : int [1:75670] 1 2 2 1 1 2 1 1 2 2 ...
  ..@ alpha          : num 25
  ..@ call           : language LDA(x = dtm_review, k = 2, method = "Gibbs", ...
  ..@ Dim            : int [1:2] 1791 9668
  ..@ control        :Formal class 'LDA_Gibbscontrol' [package "topicmodels"] ...
  ..@ beta           : num [1:2, 1:17964] -8.81 -10.14 -9.09 -8.43 -12.53 ...
  ...
Pengantar Analisis Teks di R

Menggunakan tidy()

lda_topics <- lda_out %>% 
  tidy(matrix = "beta")

lda_topics %>% arrange(desc(beta))
# A tibble: 19,336 x 3
   topic term       beta
   <int> <chr>     <dbl>
 1     1 hair     0.0241
 2     2 clean    0.0231
 3     2 cleaning 0.0201
# … dengan 19,333 baris lagi
Pengantar Analisis Teks di R

Ayo berlatih!

Pengantar Analisis Teks di R

Preparing Video For Download...