Topics interpreteren

Introductie tot tekstanalyse in R

Maham Faisal Khan

Senior Data Science Content Developer

Twee topics

lda_topics <- LDA(
  dtm_review,
  k = 2,
  method = "Gibbs",
  control = list(seed = 42)
) %>% 
  tidy(matrix = "beta")

word_probs <- lda_topics %>% group_by(topic) %>% slice_max(beta, n = 15) %>% ungroup() %>% mutate(term2 = fct_reorder(term, beta))
Introductie tot tekstanalyse in R

Twee topics

ggplot(
  word_probs, 
  aes(
    term2, 
    beta, 
    fill = as.factor(topic)
  )
) +
  geom_col(show.legend = FALSE) +
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

Introductie tot tekstanalyse in R

Drie topics

lda_topics2 <- LDA(
  dtm_review,
  k = 3,
  method = "Gibbs",
  control = list(seed = 42)
) %>% 
  tidy(matrix = "beta")

word_probs2 <- lda_topics2 %>% group_by(topic) %>% slice_max(beta, n = 15) %>% ungroup() %>% mutate(term2 = fct_reorder(term, beta))
Introductie tot tekstanalyse in R

Drie topics

ggplot(
  word_probs2, 
  aes(
    term2, 
    beta, 
    fill = as.factor(topic)
  )
) +
  geom_col(show.legend = FALSE) +
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

Introductie tot tekstanalyse in R

Vier topics

Introductie tot tekstanalyse in R

De kunst van modelselectie

  • Verschillende topics toevoegen is goed
  • Herhalen van topics = te ver gegaan
  • Geef topics een naam op basis van woorden met hoge kans
Introductie tot tekstanalyse in R

Laten we oefenen!

Introductie tot tekstanalyse in R

Preparing Video For Download...