extract di tidyr

Espressioni regolari intermedie in R

Angelo Zehr

Data Journalist

Funzioni usate finora

  • str_match
  • str_replace
  • str_match_all
  • str_replace_all
  • ...
Espressioni regolari intermedie in R

Dove regex e data frame si incontrano:

extract(
    data,
    col,
    into,
    regex = "([[:alnum:]]+)",
    remove = TRUE,
    convert = FALSE,
    ...
 )
Espressioni regolari intermedie in R

Argomenti di extract

extract(
    data,
    col,
    into,
    regex = "([[:alnum:]]+)",
    remove = TRUE,
    convert = FALSE,
    ...
 )
  • data

  • col

  • into

  • regex

  • remove

  • convert

Espressioni regolari intermedie in R

Data frame Movies

Espressioni regolari intermedie in R

Cosa possiamo fare con str_match

screenshot di una tabella

screens_per_movie %<>%
  mutate(
    is_3d = str_match(line, "3D")
  )
Espressioni regolari intermedie in R

Com’è il risultato di str_match

screenshot di una tabella

screens_per_movie %<>%
  mutate(
    is_3d = str_match(line, "3D")
  )
Espressioni regolari intermedie in R

str_match può estrarre solo un’informazione

screenshot di una tabella

Espressioni regolari intermedie in R

Ecco cosa può fare extract per noi

Espressioni regolari intermedie in R

Ecco cosa può fare extract per noi

screenshot di una tabella

extract(
  screens_per_movie,
  col = "line",
  into = c("is_3d", "screens"),
  regex = "(3D).*?(\\d+)$",
  remove = FALSE
 )
Espressioni regolari intermedie in R

Il risultato di extract

screenshot di una tabella

extract(
  screens_per_movie,
  col = "line",
  into = c("is_3d", "screens"),
  regex = "(3D).*?(\\d+)$",
  remove = FALSE
)
Espressioni regolari intermedie in R

Passons à la pratique !

Espressioni regolari intermedie in R

Preparing Video For Download...