tidyr's extract

Gevorderde reguliere expressies in R

Angelo Zehr

Data Journalist

Functies tot nu toe

  • str_match
  • str_replace
  • str_match_all
  • str_replace_all
  • ...
Gevorderde reguliere expressies in R

Waar regex en data frames samenkomen:

extract(
    data,
    col,
    into,
    regex = "([[:alnum:]]+)",
    remove = TRUE,
    convert = FALSE,
    ...
 )
Gevorderde reguliere expressies in R

De argumenten van extract

extract(
    data,
    col,
    into,
    regex = "([[:alnum:]]+)",
    remove = TRUE,
    convert = FALSE,
    ...
 )
  • data

  • col

  • into

  • regex

  • remove

  • convert

Gevorderde reguliere expressies in R

Movies-dataframe

Gevorderde reguliere expressies in R

Wat we met str_match kunnen doen

schermafbeelding van een tabel

screens_per_movie %<>%
  mutate(
    is_3d = str_match(line, "3D")
  )
Gevorderde reguliere expressies in R

Hoe het resultaat van str_match eruitziet

schermafbeelding van een tabel

screens_per_movie %<>%
  mutate(
    is_3d = str_match(line, "3D")
  )
Gevorderde reguliere expressies in R

str_match kan maar één ding matchen

schermafbeelding van een tabel

Gevorderde reguliere expressies in R

Dit kan extract voor ons doen

Gevorderde reguliere expressies in R

Dit kan extract voor ons doen

schermafbeelding van een tabel

extract(
  screens_per_movie,
  col = "line",
  into = c("is_3d", "screens"),
  regex = "(3D).*?(\\d+)$",
  remove = FALSE
 )
Gevorderde reguliere expressies in R

Het resultaat van extract

schermafbeelding van een tabel

extract(
  screens_per_movie,
  col = "line",
  into = c("is_3d", "screens"),
  regex = "(3D).*?(\\d+)$",
  remove = FALSE
)
Gevorderde reguliere expressies in R

Laten we oefenen!

Gevorderde reguliere expressies in R

Preparing Video For Download...