Gevorderde reguliere expressies in R
Angelo Zehr
Data Journalist
Begint "cat" met "c"?
De rebus-manier:
str_detect("cat", pattern = START %R% "c")
Reguliere expressie:
str_detect("cat", pattern = "^c")
str_detect(string, pattern)
str_match(string, pattern)


movie_titles <- c(
"Karate Kid",
"The Twilight Saga: Eclispe",
"Knight & Day",
"Shrek Forever After (3D)",
"Marmaduke.",
"Predators",
"StreetDance (3D)",
"Robin Hood",
"Micmacs A Tire-Larigot",
"Sex And the City 2",
...
movie_titles[
str_detect(
movie_titles,
pattern = "^K"
)
]
"Karate Kid",
"Knight & Day",
...
| Speciaal teken | Betekenis |
|---|---|
^ |
Caret: markeert het begin van een regel of string |
$ |
Dollar-teken: markeert het einde van een regel of string |
. |
Punt: matcht alles: letters, cijfers of spaties |
\\. |
Twee backslashes: escapen de punt als je een echte punt zoekt |
| Code | Resultaat |
|---|---|
str_match("Book", "^.") |
Matcht "B" |
str_match("Book", ".$") |
Matcht "k" |
str_match("Book", "\\.") |
Geen match |
str_match("Book.", "\\.") |
Matcht "." |
Gevorderde reguliere expressies in R