Welkom

Gevorderde reguliere expressies in R

Angelo Zehr

Data Journalist

Waar je misschien was gebleven

Gevorderde reguliere expressies in R

Van Rebus naar eigen expressies schrijven

Begint "cat" met "c"?

De rebus-manier:

str_detect("cat", pattern = START %R% "c")

Reguliere expressie:

str_detect("cat", pattern = "^c")
Gevorderde reguliere expressies in R

Vereisten: stringr

str_detect(string, pattern)
str_match(string, pattern)
Gevorderde reguliere expressies in R

Wat reguliere expressies je laten doen

tekstblok met highlight

Gevorderde reguliere expressies in R

Wat reguliere expressies je laten doen

tekstblok met highlights

Gevorderde reguliere expressies in R

Onze eerste dataset

movie_titles <- c(
  "Karate Kid",
  "The Twilight Saga: Eclispe",
  "Knight & Day",
  "Shrek Forever After (3D)",
  "Marmaduke.",
  "Predators",
  "StreetDance (3D)",
  "Robin Hood",
  "Micmacs A Tire-Larigot",
  "Sex And the City 2",
...
movie_titles[
  str_detect(
    movie_titles,
    pattern = "^K"
  )
]
"Karate Kid",
"Knight & Day",
...
Gevorderde reguliere expressies in R

Speciale tekens in reguliere expressies

Speciaal teken Betekenis
^ Caret: markeert het begin van een regel of string
$ Dollar-teken: markeert het einde van een regel of string
. Punt: matcht alles: letters, cijfers of spaties
\\. Twee backslashes: escapen de punt als je een echte punt zoekt
Gevorderde reguliere expressies in R

Voorbeeld

Code Resultaat
str_match("Book", "^.") Matcht "B"
str_match("Book", ".$") Matcht "k"
str_match("Book", "\\.") Geen match
str_match("Book.", "\\.") Matcht "."
Gevorderde reguliere expressies in R

Laten we oefenen!

Gevorderde reguliere expressies in R

Preparing Video For Download...