Classi di caratteri e ripetizioni

Espressioni regolari intermedie in R

Angelo Zehr

Data Journalist

Classi di caratteri disponibili

Classe di caratteri Esempio
\\d o [:digit:] 0, 1, 2, 3,…
\\w o [:word:] a, b, c…, 1, 2, 3…, _
[A-Za-z] o [:alpha:] A, B, C,…, a, b, c,…
[aeiou] a, e, i, o o u
\\s o [:space:] " ", tab o a capo
Espressioni regolari intermedie in R

Un esempio concreto

str_match_all() Risultato
"Hi John_35", "\\d" "3", "5"
"Hi John_35", "\\w" "H", "i", "J", "o", "h", "n", "_", "3", "5"
"Hi John_35", "[A-Za-z]" "H", "i", "J", "o", "h", "n"
"Hi John_35", "[aeiou]" "i", "o"
"Hi John_35", "\\s" " "
Espressioni regolari intermedie in R

Ripetizioni

Sintassi Significato
\\w{2} esattamente 2 volte
\\w{2,3} minimo 2, massimo 3 volte
\\w{2,} minimo 2, senza massimo
\\w+ 1 o più ripetizioni
\\w* 0, 1 o più ripetizioni
Espressioni regolari intermedie in R

Inversione delle classi di caratteri

Originale Negazione
\\d trova cifre \\D trova tutto tranne cifre
\\w trova caratteri parola \\W trova tutto tranne caratteri parola
\\s trova spazi \\S trova tutto tranne spazi
[a-zA-Z] trova alfabeto [^a-zA-Z] trova tutto tranne alfabeto
Espressioni regolari intermedie in R

Pattern personalizzato con classi

str_match_all("Toy Story 3", "[\\d\\s]")

Risultato:

     [,1]
[1,] " " 
[2,] " " 
[3,] "3"
Espressioni regolari intermedie in R

Passiamo alla pratica !

Espressioni regolari intermedie in R

Preparing Video For Download...