# <center> <b> <span style="color:blue;"> ETUDE DES EXPRESSIONS REGULIERES </span> </b></center>


### <left> <b> <span style="color:brown;">Présenté par : </span> </b></left>[ADEYEMI Kolawolé](https://github.com/adeyemi80)


## <center> <b> <span style="color:green;"> DEFINITIONS</span> </b></center>


Les expressions régulières( ou expressions rationnelles) sont utilisées 
dans quasiment tous les langages. Elles représentent des motifs qu'on 
recherche dans une chaîne de caractères.


Par exemple, on peut chercher dans un fichier:
    
    - les lignes qui contiennent un numéro de téléphone,
    - les lignes qui débutent par une adresse IP.
    
Par exemple, on peut chercher dans une chaîne de caractères:
    
    - une séquence qui commence par "ex" et se termine par "le",
    -les mots qui commencent par "ex",
    - les mots de quatre caractères de long,
    - les mots sans majuscules.
    
On pourra aussi remplacer dans fichier (ou dans une chaîne de caractères):
    
    - des dates au format américain par des dates au format français,
    - des logins écrits parfois avec des majuscules, des minuscules, des 
    caractères spéciaux par des logins normalisées.
    

# <center> <b> <span style="color:green;"> Le module re</span> </b></center>

Le module re fait partie de la bibliothèque standard et permet de
compiler des motifs pour obtenir des expressions rationnelles 
utilisées pour analyser des textes:
```python

       import re
    
Par exemple, si on veut appliquer un motif pattern à une chaîne 
string, on utilise les deux lignes de code suivant:
    
    
    prog = re.compile(pattern)
    
    result = prog.match(string)
```
    
    

### La fonction compile

```python
Il faut noter que les deux lignes de codes

prog = re.compile(pattern)
    
result = prog.match(string)
    
sont équivalente à : result = re.match(pattern, string)
    
        mais utiliser re.compile() et sauvegarder l'expression
        rationnelle renvoyée pour la réutiliser est plus efficace 
        quand l'expression est amenée à être utilisée plusieurs 
        fois dansun même programme.
```
    

### La fonction search

```python
re.search(pattern, string, flags=0) analyse string à la recherche du premier emplacement où 
l'expression rationnelle pattern trouve une correspance, et renvoie l'objet de correspondance 
trouvé. Renvoie None si aucune position dans la chaîne ne valide le motif; notez que cela est 
différent de trouver une correspondance avec une chaîne vide à un crertain endroit de la chaîne.

Le comportement de certaines expressions peut être reconfiguré en ajoutant un "flag" enparamètre.

- re.IGNORECASE
Ignore la case

- re.MULTILINE

Par défaut, les caractères "^" et "$" désignent le début et la fin de tout le texte. Or, 
en mode multiligne, un "^" en début de re.search() considérera le début de chaque ligne, et "$" 
leurs fins. Pour partir uniquement du début de la chaîne globale, il faut alors ne plus 
utiliser "re.search()" mais "re.match()."

- re.DOTLL

Par défaut,.* et .+ s'arrêtent aux retours chariot(\n). Pour qu'ils englobent 
ces retours à la ligne, il faut appeler re.DOTALL.
```

In [3]:
# Exemple1:
import re
chaine = "Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemment"
ratio = re.compile('m')
if ratio.search(chaine):
    print('position du m')
    print(ratio.search(chaine).start())
    print(ratio.search(chaine).end())
    


position du m
42
43


In [None]:
#42 est l'indeice du caractère m dans la chaine
#43  est l'indeice du caractère m dans la chaine + 1


In [15]:
# Exemple2:
import re
chaine = "Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemment"
ratio = re.compile('m', re.I)# re.I équivaut à re.IGNORECASE
if ratio.search(chaine):
    print('position du m')
    print(ratio.search(chaine).start())
    print(ratio.search(chaine).end())
    


position du m
0
1


In [None]:
# 0 est l'indeice du caractère m dans la chaine
# 1 est l'indeice du caractère m dans la chaine + 1
#Il y a soit un m minuscule,soit un m majuscule au début de la chaîne

### La fonction match

re.match(pattern, string, flags=0)

Si zéro ou plus de caractères au début de string correspondent à 
l'expression rationnelle pattern, elle renvoie l'objet de correspondance 
trouvé. Renvoie None si la chaîne ne correspond pas au motif; notez 
que cela est différent d'une correspondance avec une chaîne vide.

Notez que même en mode MULTILINE, re.match() ne validera qu'au début de
la chaîne et non au début de chaque ligne.

Si vous voulez trouver une correspondance n'importe où dans string, utilisez plutôt search().
                                          
                                          

In [5]:

#Exemple1:
import re
chaine = "Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemment"
ratio = re.compile('m')
print(ratio.match(chaine))

None


In [None]:
#Il n'y a pas de m minuscule au début de la chaine

In [10]:

# Exemple2:
import re
chaine = "Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemment"
ratio = re.compile('m', re.I)# re.I équivaut à re.IGNORECASE
if ratio.match(chaine):    
    print('position du m')
    print(ratio.match(chaine).start())
    print(ratio.match(chaine).end())

    

position du m
0
1


In [None]:
# 0 est l'indeice du caractère m dans la chaine
# 1 est l'indeice du caractère m dans la chaine + 1
#Il y a soit un m minuscule,soit un  m majuscule au début de la chaîne

### La fonction findall

re.findall(pattern, string, flags=0)

Retourne la liste des correspondances de patern dans la chaîne string.
Cette dernière est parcourue de gauche à droite et les correspondances
sont renvoyées dans l'ordre où elles sont trouvées.

In [6]:

# Exemple:
import re
chaine = "Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemment"
ratio = re.compile('re', re.I)
print(ratio.findall(chaine))


['re', 're']


### La fonction sub

In [None]:
re.sub(pattern, repl, string, count=0, flags=0)

Renvoie la chaîne obtenue en remplaçant les occurrences(sans chevauchement) 
les plus à gauche de pattern dans string par le remplacement repl. Si le motif
n'est pas trouvé, string est renvoyée inchangée. repl peut être une chaîne de 
caractères ou une fonction

In [9]:

import re
chaine = "Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemment"
ratio = re.sub('me','ta', chaine)
print(ratio)


Mélodie Monchel reçoit la gifle qu'elle semblait attendre patiemtant


In [None]:
# Le me a été remplacé par ta

## Utilisation de pythex pour retrouvrer les motifs et des re

Allez sur <a href="pythex.org">https://pythex.org/</a> 
    copier l'url dans un navigateur pour avoir accès à pythex