Adım 3: Metin düzenleme

R ile Bag-of-Words ile Metin Madenciliği

Ted Kwartler

Instructor

qdap ile metin düzenleme

# qdap temizlik fonksiyonu
qdap_clean <- function(x) {
  x <- replace_abbreviation(x)
  x <- replace_contraction(x)
  x <- replace_number(x)
  x <- replace_ordinal(x)
  x <- replace_symbol(x)
  x <- tolower(x)
  return(x)
}
R ile Bag-of-Words ile Metin Madenciliği

tm ile metin düzenleme

# tm temizlik fonksiyonu
tm_clean <- function(corpus) {
  tm_clean <- tm_map(corpus, removePunctuation)
  corpus <- tm_map(corpus, stripWhitespace)
  corpus <- tm_map(corpus, removeWords,
              c(stopwords("en"), "Google", "Amazon", "company"))
  return(corpus)
}
R ile Bag-of-Words ile Metin Madenciliği

Derlemlerinizi temizleme

 

Temizlenmiş derlemeler

R ile Bag-of-Words ile Metin Madenciliği

Hadi pratik yapalım!

R ile Bag-of-Words ile Metin Madenciliği

Preparing Video For Download...