Metode jarak string

Ekspresi Reguler Tingkat Menengah di R

Angelo Zehr

Data Journalist

Damerau-Levenshtein

typo rick caplan

Ekspresi Reguler Tingkat Menengah di R

Singkatan metode

Jarak Levenshtein biasa:

stringdist(a, b, method = "lv")

Jarak Damerau-Levenshtein:

stringdist(a, b, method = "dl")

Jarak Optimal String Alignment:

stringdist(a, b, method = "osa")
Ekspresi Reguler Tingkat Menengah di R

Q-gram (atau n-gram)

qgram honolulu

Ekspresi Reguler Tingkat Menengah di R

Q-gram (atau n-gram)

qgram honolulu hanolulu

Ekspresi Reguler Tingkat Menengah di R

Meninjau q-gram

qgrams("Honolulu", "Hanolulu", q = 2)

Menghasilkan:

   Ho on ul no ol lu la
V1  1  1  1  1  1  2  0
V2  1  1  1  1  1  1  1
Ekspresi Reguler Tingkat Menengah di R

Singkatan metode

Jumlah qgram yang tidak sama

stringdist(a, b, method = "qgram") # equals 4

Qgram yang tidak sama dibagi total qgram

stringdist(a, b, method = "jaccard") # equals 0.5

Jarak Optimal String Alignment

stringdist(a, b, method = "cosine") # equals 0.22
Ekspresi Reguler Tingkat Menengah di R

Ayo berlatih!

Ekspresi Reguler Tingkat Menengah di R

Preparing Video For Download...