Düzenli ifade temelleri

R ile Doğal Dil İşlemeye Giriş

Kasey Jones

Research Data Scientist

Doğal dil işleme nedir?

NLP:

  • Metni analiz edip anlamak için bilgisayarların kullanılması

Konu başlıkları:

  • Metin Sınıflandırma
  • Konu Modellemesi
  • Ad Öbeği Tanıma (NER)
  • Duygu Analizi
R ile Doğal Dil İşlemeye Giriş

Düzenli ifadeler nedir?

  • Metin aramak için kullanılan bir karakter dizisi
  • Örnekler:
    • komut satırında dizindeki dosyaları arama
    • belirli bir deseni içeren yazıları bulma
    • belirli metni değiştirme
    • ...
R ile Doğal Dil İşlemeye Giriş

Örnekler

words <- c("DW-40", "Mike's Oil", "5w30", "Joe's Gas", "Unleaded", "Plus-89")
# Rakamları bulma
grep("\\d", words, value = TRUE)
[1] 1 3 6
# Kesme işareti bulma
grep("\\'", words, value = TRUE)
[1] "Mike's Oil"     "Joe's Gasoline"
R ile Doğal Dil İşlemeye Giriş

Düzenli İfade Örnekleri

Örüntü Eşleşen Metin R Örneği Metin Örneği
\w Herhangi bir alfasayısal gregexpr(pattern ='\w', <text>) a
\d Herhangi bir rakam gregexpr(pattern ='\d', text) 1
\w+ Her uzunlukta alfasayısal gregexpr(pattern ='\w+', text) word
\d+ Her uzunlukta rakamlar gregexpr(pattern ='\d+', text) 1234
\s Boşluklar gregexpr(pattern ='\s', text) ' '
\S Boşluk olmayan gregexpr(pattern ='\S', text) word
R ile Doğal Dil İşlemeye Giriş

R Örnekleri

Fonksiyon Amaç Söz dizimi
grep Vektörde desen eşleşmelerini bulur grep(pattern ='\w', x = <vector>, value = F)
gsub Bir dize/vektördeki tüm eşleşmeleri değiştirir gsub(pattern ='\d+', replacement = "", x = <vector>)
R ile Doğal Dil İşlemeye Giriş

RegEx Alıştırması

1 https://regexone.com/lesson/matching_characters
R ile Doğal Dil İşlemeye Giriş

Kodlama zamanı!

R ile Doğal Dil İşlemeye Giriş

Preparing Video For Download...