R ile Doğal Dil İşlemeye Giriş
Kasey Jones
Research Data Scientist
NLP:
Konu başlıkları:
words <- c("DW-40", "Mike's Oil", "5w30", "Joe's Gas", "Unleaded", "Plus-89")
# Rakamları bulma
grep("\\d", words, value = TRUE)
[1] 1 3 6
# Kesme işareti bulma
grep("\\'", words, value = TRUE)
[1] "Mike's Oil" "Joe's Gasoline"
| Örüntü | Eşleşen Metin | R Örneği | Metin Örneği |
|---|---|---|---|
| \w | Herhangi bir alfasayısal | gregexpr(pattern ='\w', <text>) | a |
| \d | Herhangi bir rakam | gregexpr(pattern ='\d', text) | 1 |
| \w+ | Her uzunlukta alfasayısal | gregexpr(pattern ='\w+', text) | word |
| \d+ | Her uzunlukta rakamlar | gregexpr(pattern ='\d+', text) | 1234 |
| \s | Boşluklar | gregexpr(pattern ='\s', text) | ' ' |
| \S | Boşluk olmayan | gregexpr(pattern ='\S', text) | word |
| Fonksiyon | Amaç | Söz dizimi |
|---|---|---|
| grep | Vektörde desen eşleşmelerini bulur | grep(pattern ='\w', x = <vector>, value = F) |
| gsub | Bir dize/vektördeki tüm eşleşmeleri değiştirir | gsub(pattern ='\d+', replacement = "", x = <vector>) |
R ile Doğal Dil İşlemeye Giriş