Nous avons vu que les classes étaient pratiques pour chercher un caractère au sein d'un groupe, ce qui permet de trouver un caractère sans savoir au préalable quel sera ce caractère. Seulement, utiliser des classes alourdit fortement la syntaxe des regex et les rend difficilement lisibles. Pour pallier ce petit souci, nous allons utiliser ce que l'on appelle des types génériques. Certains parlent aussi de « classes raccourcies », mais ce terme n'est pas tout à fait exact.
Les types génériques s'écrivent tous de la manière suivante : \x, où x représente une lettre. Voici la liste de tous les types génériques :
Type |
Description |
\d |
Trouve un caractère décimal (un chiffre) |
\D |
Trouve un caractère qui n'est pas décimal (donc pas un chiffre) |
\s |
Trouve un caractère blanc |
\S |
Trouve un caractère qui n'est pas un caractère blanc |
\w |
Trouve un caractère « de mot » : une lettre, accentuée ou non, ainsi que l'underscore |
\W |
Trouve un caractère qui n'est pas un caractère « de mot » |
En plus de cela existent les caractères de type « espace blanc » :
Type |
Description |
Trouve un retour à la ligne |
|
Trouve une tabulation |
Ces deux caractères sont reconnus par le type générique \s (qui trouve, pour rappel, n'importe quel espace blanc).
Les assertions s'écrivent comme les types génériques mais ne fonctionnent pas tout à fait de la même façon. Un type générique recherche un caractère, tandis qu'une assertion recherche entre deux caractères. C'est tout de suite plus simple avec un tableau :
Type |
Description |
\b |
Trouve une limite de mot |
\B |
Ne trouve pas de limite de mot |
Il faut juste faire attention avec l'utilisation de \b, car cette assertion reconnaît les caractères accentués comme des « limites de mots ». Ça peut donc provoquer des comportements inattendus.
Ce n'est pas fini ! Les regex reviennent dès le chapitre suivant, où nous étudierons leur utilisation avec diverses méthodes Javascript.
Créé avec HelpNDoc Personal Edition: Générateur de documentation iPhone gratuit