Dize uzaklık yöntemleri

R ile Orta Düzey Düzenli İfadeler

Angelo Zehr

Data Journalist

Damerau-Levenshtein

rick caplan typo

R ile Orta Düzey Düzenli İfadeler

Yöntem kısaltmaları

Standart Levenshtein uzaklığı:

stringdist(a, b, method = "lv")

Damerau-Levenshtein uzaklığı:

stringdist(a, b, method = "dl")

Optimal String Alignment uzaklığı:

stringdist(a, b, method = "osa")
R ile Orta Düzey Düzenli İfadeler

Q-gramlar (veya n-gramlar)

honolulu qgrams

R ile Orta Düzey Düzenli İfadeler

Q-gramlar (veya n-gramlar)

honolulu hanolulu qgrams

R ile Orta Düzey Düzenli İfadeler

Q-gramları inceleme

qgrams("Honolulu", "Hanolulu", q = 2)

Döndürür:

   Ho on ul no ol lu la
V1  1  1  1  1  1  2  0
V2  1  1  1  1  1  1  1
R ile Orta Düzey Düzenli İfadeler

Yöntem kısaltmaları

Paylaşılmayan q-gramların toplamı

stringdist(a, b, method = "qgram") # equals 4

Paylaşılmayan q-gramlar / toplam q-gram sayısı

stringdist(a, b, method = "jaccard") # equals 0.5

Optimal String Alignment uzaklığı

stringdist(a, b, method = "cosine") # equals 0.22
R ile Orta Düzey Düzenli İfadeler

Hadi pratik yapalım!

R ile Orta Düzey Düzenli İfadeler

Preparing Video For Download...