# Langages de script - Python

## Cours 4 - Fonctions et module re

### M2 Ingénierie Multilingue - INaLCO

Clément Plancq - clement.plancq@ens.fr

# Fonctions

- elles ont un nom, prennent des arguments, font un traitement et renvoient une valeur

- elles doivent être documentées. En Python on utilise les docstrings

In [None]:
def ma_fonction(arg1, arg2):
    """
    La documentation de ma fonction
    Sur plusieurs lignes si je veux
    """
    return

- Les docstrings sont accessibles dans la console avec help(ma_fonction) ou dans le script via l'attribut `__doc__`: `ma_fonction.__doc__`

- Les générateurs de documentation comme [sphinx](http://www.sphinx-doc.org) utilisent les docstrings

# Fonctions : arguments

## Arguments positionnels

In [None]:
def retranche(arg1, arg2):
    """Une soustraction quoi"""
    return arg1 - arg2

In [None]:
retranche(4, 2)

In [None]:
retranche(2, 4)

# Fonctions : arguments

## Arguments avec valeurs par défaut

Ici arg1 est obligatoire, arg2 est facultatif

In [None]:
def retranche(arg1, arg2=1):
    """Une soustraction quoi"""
    return arg1 - arg2

In [None]:
retranche(4, 1)

In [None]:
retranche(4)

# Fonctions : arguments

## Arguments nommés (keywords arguments aka kwargs)

- Les fonctions peuvent aussi être appelées avec des arguments nommés
- Dans ce cas l'ordre n'a pas d'importance
- On peut mélanger les deux, mais alors les keywords doivent être en dernier

In [None]:
def retranche(arg1, arg2=1):
    """Une soustraction quoi"""
    return arg1 - arg2

In [None]:
retranche(arg1=4, arg2=2)

In [None]:
retranche(arg2=2, arg1=4)

In [None]:
retranche(4, arg2=3)

# Fonctions : arguments

## Nombre d'arguments arbitraire

In [None]:
def print_artist(name, *records):
    print(name)
    for item in records:
        print(item)
print_artist("Neil Young", "Ragged Glory", "Harvest Moon")

# Fonctions : arguments

## Nombre d'arguments arbitraire

On peut aussi utiliser des kwargs (keyword arguments)

In [None]:
def print_artist(name, *records, **concerts):
    print(name)
    for item in records:
        print(item)
    for place, date in concerts.items():
        print(place, date)
print_artist("Neil Young", "Ragged Glory", "Harvest Moon", Paris='12/10/2016', Albuquerque="14/11/2016")

# Fonctions : portée des variables

- Les variables déclarées dans le corps d'une fonction ont une portée locale à la fonction

- Les variables globales (c-à-d dans le main) sont accessibles en lecture dans une fonction

- Pour modifier une variable globale dans une fonction il faut la faire précéder du mot-clé `global`
    - Souvent source de bug, à éviter

- Les variables passées en arguments ne sont pas modifiées par la fonction

# ATTENTION !

## Argument mutable

Les arguments de type `mutable` (`list`, `dictionnaire`) peuvent être modifiés par la fonction

In [None]:
def ma_fonction(val, list):
    list.append(val)
    return list
list = [1, 2, 3]

In [None]:
ma_fonction(4, list)

In [None]:
ma_fonction(4, list)

# ATTENTION !

## Argument mutable

Si ce n'est pas le comportement voulu il faut penser à faire une copie de la liste

In [None]:
list = [1, 2, 3]
ma_fonction(4, list[:])

# Module `re`

- `re` est un module particulièrement important, vous devez lire la [doc](https://docs.python.org/3/library/re.html), absolument

- La doc officielle est parfois aride, ce [howto](https://docs.python.org/3.6/howto/regex.html) rédigé par A.M. Kuchling est plus digeste

# Module `re`

a minima vous devez connaître les fonctions :

- `compile` : compilation d'un motif (pattern), retourne un objet `Pattern`
- `findall` : trouve toutes les occurences du motif, retourne une liste de chaînes trouvées
- `search` : trouve le motif, retourne un objet `Match`, `None` sinon
- `match` : détermine si le motif est présent au début de la chaîne, retourne un objet `Match`, `None` sinon
- `split` : découpe une chaîne selon un motif, retourne une liste de chaînes
- `sub` : remplace les occurences d'un motif par une chaîne de remplacement

# Module `re`

## Avec compilation du motif

In [None]:
pat = re.compile("(\w|\s)+")
if pat.search("Un léopard me pourchasse"):
    print("Cours !")

## Sans compilation

In [None]:
if re.search("(\w|\s)+", "Un léopard me pourchasse"):
    print("Cours !")

In [None]:
pat = re.compile('e|é')
pat.sub('i', 'éléphanteau')

# Module `re`

## `\w` et Python3

`\w` est la classe prédéfinie des caractères alaphanumériques :

- En Python2 `\w` correspond à `[A-Za-z0-9_]`, avec les locales il est possible d'y ajouter d'autres caractères

- En Python3 `\w` correspond à tous les caractères qui ont la propriété Unicode Letter d'après le module `unicodedata` (sauf si le motif est compilé en binaire ou si l'option `re.ASCII` est activée)

In [None]:
if re.search("(\w|\s)+", "馬青區團長成中央代表"):
    print("Yeah !")

In [None]:
if re.search("(\w|\s)+", "هيلاري كلينتون"):
    print("Yeah !")

# Module `re`

## Les fonctions match et search renvoient un objet Match

L'objet est évalué comme True s'il est testé mais il peut livrer plus d'informations :

- `m.group()` la chaîne trouvée (matchée)
- `m.start()` l'indice de la position initiale de la chaîne
- `m.end()` l'indice de la position finale de la chaîne
- `m.span()` le tuple indice début, fin de la chaîne

In [None]:
m = re.search("l[ae]s?", "Après la pluie, le beau temps")
m.group()

# Module `re`

## Les fonctions match et search renvoient un objet Match

Si le motif comporte des groupes de capture :
- `m.group(1)` renvoie la chaîne correspond au 1er groupe, etc.
- `m.groups()` renvoie un tuple comportant autant d'éléments qu'il y a de groupes

In [None]:
m = re.search("(l[ae]s?)\s(\w+)", "Après la pluie, le beau temps")
m.groups()

# Module `re`

- Remplacer les articles 'le' ou 'Le' par 'un' dans la phrase : « Le soir est le moment de la journée où le jour touche à sa fin »

- Trouver dans le [fichier d'export csv de lexique.org](noms-lexique.org.txt) les noms dont le lemme se termine par '-ure'. Affichez la liste des formes : ortho / phon / lemme

- À l'aide du module `requests` trouver les liens hypertextes présents dans la page `https://www.reddit.com/r/Python/`. Affichez la liste suivante : ancre: lien

# Exos

1. Le suffixe `-able` (ou `-ible` ou `-uble`) est utilisé pour former des adjectifs à partir des verbes. Vous travaillerez avec les données de [lexique3.81](http://lexique.org/telLexique.php)
    1. Pour chaque verbe du premier groupe (utilisez le lemme) vous vérifierez s'il existe un adjectif en -able. Vous donnerez les décomptes en résultat (combien de verbes avec adjectif -able, combien sans)
    2. Pour chaque adjectif en -able vous vérifierez s'il existe un dérivé négatif (in-X-able, touchable/intouchable par ex.). En plus de l'affichage des comptes vous donnerez le pourcentage d'adjectifs en -able pour lesquels le dérivé négatif est plus fréquent (utilisez la colonne '7_freqlemfilms2).

2. Codin Game : [Racing duals](https://www.codingame.com/ide/puzzle/horse-racing-duals)