Pencocokan Fuzzy Kustom

Ekspresi Reguler Tingkat Menengah di R

Angelo Zehr

Data Journalist

Menggabungkan dua kecocokan fuzzy

tabel film

Ekspresi Reguler Tingkat Menengah di R

Menggabungkan dua kecocokan fuzzy

kolom disorot

Ekspresi Reguler Tingkat Menengah di R

Kecocokan fuzzy: Fungsi pembantu

Untuk perbandingan string:

small_str_distance <- function(left, right) {
  stringdist(left, right) <= 5
}

Untuk perbandingan angka:

close_to_each_other <- function(left, right) {
  abs(left - right) <= 3
}
Ekspresi Reguler Tingkat Menengah di R

Fuzzy join

fuzzy_left_join(
  a, b,
  by = c(
    "title" = "prod_title",
    "year" = "prod_year"
  ),
  match_fun = c(
    "title" = small_str_distance,
    "year" = close_to_each_other
  )
)
Ekspresi Reguler Tingkat Menengah di R

Fuzzy join: Hasil

tabel hasil gabungan

Ekspresi Reguler Tingkat Menengah di R

Ayo berlatih!

Ekspresi Reguler Tingkat Menengah di R

Preparing Video For Download...