« Aide:Expressions régulières » : différence entre les versions
Création |
doc |
||
(Une version intermédiaire par le même utilisateur non affichée) | |||
Ligne 1 : | Ligne 1 : | ||
Une ''expression régulière'' (de l’anglais ''regular expression'' — en français ''expression rationnelle'') consiste en une suite de caractères nommée motif (''pattern'') permettant de décrire une chaine de caractères et d'en chercher les occurrences dans un texte, pour leur appliquer un traitement comme les remplacer, supprimer, compléter (voir [http://fr.wikipedia.org/wiki/Expression_rationnelle Wikipedia]). | |||
Un motif est écrit avec des caractères ordinaires et des caractères affectés de rôles spéciaux de substitution, de groupement et de quantification. | |||
Par défaut un caractère ordinaire se représente lui-même. On peut annuler le rôle spécial d'un caractère, et ainsi le faire devenir ordinaire, en le faisant précéder de "\" (sauf quand il est entre crochets). | |||
{| class="wikitable centre cellgauche" width="60%" | {| class="wikitable centre cellgauche" width="60%" | ||
|------------------ | |------------------ | ||
|[] | |[] | ||
Ligne 16 : | Ligne 17 : | ||
|------------------ | |------------------ | ||
|() | |() | ||
| | |Isole ou regroupe une partie de l'expression | ||
|} | |||
{| class="wikitable centre cellgauche" width="60%" | |||
|------------------ | |------------------ | ||
|* | |* | ||
Ligne 29 : | Ligne 34 : | ||
|{} | |{} | ||
|Indiquent un nombre d'occurrences du motif précédent | |Indiquent un nombre d'occurrences du motif précédent | ||
|} | |||
{| class="wikitable centre cellgauche" width="60%" | |||
|------------------ | |------------------ | ||
|. | |. | ||
|Représente un caractère quelconque | |Représente un caractère quelconque | ||
|------------------ | |------------------ | ||
|{{ | |{{!}} | ||
|Représente une alternative, le motif qui précède | |Représente une alternative, le motif qui précède OU celui qui suit | ||
|------------------ | |------------------ | ||
|^ | |^ | ||
Ligne 44 : | Ligne 53 : | ||
Ligne 71 : | Ligne 80 : | ||
|\S | |\S | ||
|Le complément de \s | |Le complément de \s | ||
|} | |||
Les chaines correspondant aux occurrences trouvées sont stockées et peuvent être utilisées : | |||
{| class="wikitable centre cellgauche" width="60%" | |||
|------------------ | |||
|$& | |||
|Contient la dernière occurrence trouvée | |||
|------------------ | |||
|$+ | |||
|Contient la dernière partie d'occurrence correspondant à un motif entre parenthèses | |||
|------------------ | |||
|$1 à $9 | |||
|Contiennent les dernières parties d'occurrence correspondant aux motifs entre parenthèses dans l'ordre de leur apparition dans l'expression | |||
|} | |} | ||
==Exemples== | ==Exemples== |
Dernière version du 15 mai 2014 à 11:24
Une expression régulière (de l’anglais regular expression — en français expression rationnelle) consiste en une suite de caractères nommée motif (pattern) permettant de décrire une chaine de caractères et d'en chercher les occurrences dans un texte, pour leur appliquer un traitement comme les remplacer, supprimer, compléter (voir Wikipedia).
Un motif est écrit avec des caractères ordinaires et des caractères affectés de rôles spéciaux de substitution, de groupement et de quantification.
Par défaut un caractère ordinaire se représente lui-même. On peut annuler le rôle spécial d'un caractère, et ainsi le faire devenir ordinaire, en le faisant précéder de "\" (sauf quand il est entre crochets).
[] | Contient une liste de caractères possibles |
- | Situé entre deux caractères dans une liste, représente l'intervalle entre eux dans la table ascii |
() | Isole ou regroupe une partie de l'expression |
* | Représente 0 à n occurrences du motif précédent |
+ | Représente 1 à n occurrences du motif précédent |
? | Représente 0 ou 1 occurrence du motif précédent |
{} | Indiquent un nombre d'occurrences du motif précédent |
. | Représente un caractère quelconque |
Représente une alternative, le motif qui précède OU celui qui suit | |
^ | Placé en début d'expression indique qui commence par... Placé au début d'une liste [] indique qui ne contient pas... |
$ | Placé en fin d'expression indique qui termine par... |
Il existe aussi des séquences représentant des types de caractères prédéfinis :
\b | Représente le début ou la fin d'un mot |
\B | Représente une partie de mot située ni au début ni à la fin du mot |
\d | Représente un caractère numérique (équivalent à [0-9]) |
\w | Représente un caractère non alphanumérique (équivalent à [^a-zA-Z0-9_]) |
\n | Représente un saut de ligne |
\s | Représente un caractère "blanc" (espace, tabulation, saut de ligne) |
\S | Le complément de \s |
Les chaines correspondant aux occurrences trouvées sont stockées et peuvent être utilisées :
$& | Contient la dernière occurrence trouvée |
$+ | Contient la dernière partie d'occurrence correspondant à un motif entre parenthèses |
$1 à $9 | Contiennent les dernières parties d'occurrence correspondant aux motifs entre parenthèses dans l'ordre de leur apparition dans l'expression |