# Cinquième séance : modularité

- auteur : <a href="mailto:lentz@insa-toulouse.fr">A. Lentz</a>
- date : 2023

On présente comment écrire un module, puis comment utiliser des modules classiques.

**Remarque :** vous avez déjà utilisé le module `sys` et ses fonctions `getrefcount` et `getsizeof`. Ce module permet aussi de modifier la taille de la pile d'appel avec `setrecursionlimit`. Pratique pour faire un peu de récursivité.

## 1) Création d'un module

Lorsque votre code devient volumineux, il devient important de le partitionner en plusieurs fichiers thématiques, appelés modules. Cette logique est similaire à celle des packages en ADA. 

On va commencer par voir comment écrire soi-même un module. L'exemple que nous allons prendre a été suggéré par ChatGPT : *développer un chatbot*.

### a) Ecriture d'un module

Suivez ces instructions :

i) Dans le même dossier que celui du sujet de TD, créer un fichier `chatbot.py`

ii) Dans ce fichier, écrire une fonction `greeting` qui prend un nom en paramètre et **renvoie** un message disant bonjour à la personne dont le nom à été donné.

iii) Ajouter une fonction `fareweels` qui ne prend pas de paramètre et **renvoie** un message disant au revoir.

iv) Sauvegarder votre fichier.

**Remarque :** pas besoin d'utiliser une syntaxe spécifique pour un module. Ecrivez le comme un script normal.

###  b) Importer un module

Exécutez la cellule suivante afin d'éviter un problème de mise à jour. Si on importe un module, qu'on le modifie et qu'on le réimporte, la mise à jour ne se fera pas.

In [None]:
#spécifique aux notebook
%load_ext autoreload

On va importer votre fichier (c'est un module) avec la syntaxe suivante : `import chatbot` (pas besoin de l'extention `.py`). Ensuite, on peut utiliser n'importe quelle fonction du module `chatbot` en rajoutant le nom du module devant le nom de la fonction. Rien d'exotique : c'est l'équivalent du `with` en ADA.

In [None]:
%autoreload # pour mettre à jour si vous relancer cette cellule plusieurs fois, à ne pas retenir

import chatbot

votreNom = "" # à remplacer
print(chatbot.greeting(votreNom))

Si on ne veut importer qu'une fonction, on peut utiliser la syntaxe suivante :

In [None]:
%autoreload

from chatbot import farewells

print(farewells()) #pas besoin du nom du module avec cette syntaxe

On peut ajouter tout le contenu d'un module avec la syntaxe suivante :

In [None]:
from chatbot import *

print(greeting(votreNom))
print(farewells())

**Remarque :** cette syntaxe est l'équivalent d'un `with nomModule; use nomModule;` en ADA. Pratique pour aller vite mais dangeureux. Si on importe plusieurs modules contenant chacun une fonction de même nom, le dernier import efface les précédentes définitions.

Le `renames`se retrouve aussi en Python avec le mot clé `as`.

In [None]:
import chatbot as chat

chat.farewells()

### c) Compléter le script

On va rajouter quelques fonctionnalités à notre module.

i) Dans le fichier `chatbot.py`, rajoutez la fonction `chatbox` dont voici une version incomplète.

**Rappel :** la fonction `input` prend en paramètre un texte à afficher et renvoie sous forme de `string` la réponse de l'utilisateur.

ii) Pour arrêter le dialogue, il faut écrire un message contenant "au revoir". Remplacez la condition de la boucle. Pas besoin de recoder une fonction `sous_mot` comme vous l'avez fait dans le TD2, le mot clé `in` est votre ami.

iii) Dans la boucle, on veut ne demander le nom de l'utilisateur que si celui-ci vient de dire une phrase contenant "bonjour". Modifiez la condition du branchement conditionnel dans ce sens.

iv) Si un utilisateur écrit "Au revoir !", "Allez ! Au Revoir !" ou encore "aaU rEVOIR !!", votre code ne marche plus. En utilisant une méthode du type `string`, retirez la dépendance aux majuscules.

v) Ajoutez au début de votre module la ligne suivante : `user_count = 0`. Vous venez de rajouter une variable globale.

vi) Incrémentez ce compteur à chaque fois que chatbot reçoit un message contenant `bonjour`. Pour utiliser une variable globale, ajoutez au début de la fonction : `global user_count`.

vii) Dans la fonction `greeting`, mettez à jour le message pour afficher aussi le numéro de l'utilisateur.

In [None]:
%autoreload

import chatbot
chatbot.chatbot()

## 2) Utilisation du module math

In [3]:
import math

Pour les outils mathématiques de bases, on peut utiliser le module `math`. La documentation peut être trouvée à la page suivante : <a href="https://docs.python.org/3/library/math.html#module-math">lien</a>.

En particulier, on y trouve une valeur spécifique : `math.inf` qui représente $+\infty$. C'est bien pratique quand on cherche le minimum d'une liste d'entiers. On parcourt la liste en comparant la valeur courante avec le minimum vu pour l'instant : c'est l'algorithme ci-dessous.

Mais comment initialiser `min_vu` ? Trois solutions :
- On met une valeur suffisament grande. Mais si on n'a pas de borne inférieure sur les valeurs de la liste ? J'espère que vous ne mettez plus :`min_vu = 10000` maintenant. 
- On peut mettre n'importe quelle valeur de la liste car elle sera supérieure ou égale au minimum. C'est vrai pour la première en particulier : `min_vu = L[0]`. Et si la liste est vide ? Cette technique ne marche pas non plus dans des cas plus complexes : si on cherche le minimum des éléments pairs par exemple. On pourrait s'en sortir avec un booléen mais la troisième solution va vous simplifier la vie.
- On initialise à $min\_vu=+\infty$. En ADA, vous pouvez utiliser `Integer'Last`, en Python `math.inf`. Cette valeur sera nécessairement supérieure au minimum.

In [None]:
def min_list_pair(L):
    """
    Renvoie le plus petit élément pair de la liste
    Et math.inf si aucun élément n'est pair
    """
    min_vu = math.inf
    for x in L:
        if x%2==0 and x < min_vu:
            min_vu = x
    return min_vu
        

**Exercice :** ouvrez la documentation du module `math` et cherchez quelle(s) fonction(s) utiliser pour chaque question.

1) On définit la suite $(u_n)_{n\geq 1}$ : 
$$
u_n = \frac{(-1)^n \cdot n \cdot \cos(n)}{n \cdot \sqrt{n} +\sin(n)}.
$$
Déterminez expérimentalement si cette suite semble converger en $+\infty$ ? La fonction `math.isclose` peut vous éviter d'écrire un test de proximité entre deux flottants comme on l'a fait (improprement) lors du TD1. 

In [None]:
def u_n(n):
    return math.pow(-1,n)*n*math.cos(n)/(n*math.sqrt(n)+math.sin(n))

for i in range(100000,200000):
    assert(math.isclose(u_n(i),0,abs_tol=0.01)) #semble converger vers 0

2) Et la série de terme général $u_n$ ? Autrement dit, la suite $\left(\sum\limits_{k=1}^{n}{u_k} \right)_{n\geq 1}$ semble t'elle converger quand $n$ tend vers $+\infty$ ?

In [None]:
def serie(suite,n):
    somme = 0
    for i in range(1,n+1):
        somme += suite(i)
    return somme

serie(u_n,1000000) #la série semble converger vers -0.27 environ
#on peut montrer formellement qu'elle est convergente

3) La formule de Stirling donne un équivalent en $+\infty$ de la factorielle :
$$
n! \sim \sqrt{2\pi n} \left( \frac{n}{e} \right)^n
$$
Vérifier cette équivalence expérimentalement. 

**Attention :** rappelez vous la définition de l'équivalence : 
$$
f \sim g \Leftrightarrow f(n) = g(n) + o(g(n))
$$
Donc la différence ne tend pas nécessairement vers $0$, elle est juste négligeable par rapport à $g$.

In [4]:
def stirling(n):
    return math.sqrt(2*math.pi*n)*math.pow(n/math.e,n)

n = 150
print(stirling(n)/math.factorial(n)) #égal à 1 + o(1)
print((stirling(n)-math.factorial(n))/math.factorial(n)) # o(1)

0.9994445995594481
-0.0005554004405519259


4) On peut déduire de cette formule que :
$$
\log(n!) \sim n \log(n)
$$
Vérifier de même la cohérence de cette équivalence.

**Remarque :** cette dernière est bien pratique pour le calcul de complexité. Par exemple, on peut montrer qu'en ordre de grandeur, la complexité minimale d'un tri par comparaison est au moins en $n\log n$. Le tri par dénombrement vu au TD2 était linéaire mais utilisait une hypothèse forte sur les données à trier : les valeurs étaient bornées.

In [None]:
n=100000

print(math.log(math.factorial(n))/(n*math.log(n)))

Pour accélérer le calcul, on peut remarquer que $\log(n!)=\sum\limits_{k=1}^n{\log(k)}$.

In [None]:
n=10000000

somme = 0
for i in range(1,n):
    somme += math.log(i)
    
print(somme/(n*math.log(n)))

Mais ce n'est peut-être pas encore convainquant. D'où l'intérêt d'une preuve formelle.

## 3) Utilisation du module random

Le module `random` fournit des fonctions permettant de générer des valeurs aléatoires. Par exemple, avec la fonction `random.shuffle`, on retrouve la permutation que l'on a vu à la fin du TD4.

In [None]:
import random

### a) Générateurs

Une autre fonction très utile est `random.randint`. Elle prend en paramètre deux entiers et renvoie un entier aléatoire entre les deux paramètres (inclus).

In [None]:
for i in range(10):
    print(random.randint(3,5))

Le générateur sous-jacent est similaire à celui vu pour permuter aléatoirement une chaîne de caractère lors du TD4. Il y a une suite $(u_n)_n$ d'entiers pseudo-aléatoire. Et la fonction `randint` calcule $u_0$ lors du premier appel, puis $u_1$ lors du deuxième, etc... 

Mais comment fait elle pour se souvenir d'où elle en était et ne pas calculer la même valeur à chaque fois ? C'est ce qu'on appelle un  générateur. Donnons un petit exemple déterministe.

In [6]:
def f():
    x=0
    while x<10:
        yield x
        x=x+1  

Le mot clé `yield` permet de mettre en pause la fonction et de renvoyer une valeur. Lorsqu'elle est rappelée, elle ne recommence pas au début, mais juste après le yield.

Ici, un premier appel à $f$ met `x` à $0$, rentre dans la boucle, puis renvoie $0$. Un deuxième appel repart de la ligne `x=x+1` en se souvenant que `x` contient $0$. Un troisième appel repart donc avec `x` contenant $1$.

On ne peut pas appeler `f` pour récupérer les valeurs successives. `f()` renvoie ce qu'on appelle un générateur. Puis on peut appeler ce générateur avec la fonction `next`.

In [7]:
g = f() #on initialise un générateur dans g
print(next(g)) #on appelle la fonction la première fois
print(next(g)) #on la rappelle : ça repart de x=x+1 et x contient 0 au début
print(next(g)) #on la rappelle : ça repart de x=x+1 et x contient 1 au début
print(next(g)) #on la rappelle : ça repart de x=x+1 et x contient 2 au début
print(next(g)) #on la rappelle : ça repart de x=x+1 et x contient 3 au début

0
1
2
3
4


C'est ce fonctionnement qui est utilisé pour générer des valeurs aléatoires : `random.randint` cache un `next(g)` avec `g` bien choisi.

Un avantage important des générateurs est de pouvoir itérer sur les valeurs.

In [None]:
for i in f():
    print(i)

C'est exactement la même chose qui se passe quand vous utilisez `range`.

In [None]:
for i in range(10000):
    pass

Au moyen-âge, Python 2 générait une liste contenant les entiers de $0$ à $9999$, puis $i$ itérait sur cette liste. Ce qui est coûteux en mémoire et inutile : il suffit d'avoir un compteur $i$ et de l'incrémenter à chaque étape. Depuis Python 3, `range` est un générateur : à chaque itération, une fonction mémorise le $i$ courant et est rappelée : elle le modifie pour passer à l'étape suivante et le renvoie. Si un jour vous voyez `xrange`, c'est l'équivalent de `range` mais en Python 2.

### b) Exercices

**Exercice 1 :** Ecrire un générateur d'entiers aléatoires. Vous avez le droit d'utiliser la fonction `suivant` qui est donné à la fin du TD4. 

In [None]:
def suivant():
    """
    renvoie un entier pseudo aléatoire
    """
    u = 3
    while True:
        u = (227608 * u + 9204) % 59049
        yield u
        
gen_rand = suivant()
for i in range(10):
    print(next(gen_rand))

**Exercice 2 :** une loi géométrique correspond à faire des tirages aléatoires jusqu'à obtenir un succès. Par exemple, on lance une pièce en boucle et on s'arrête dès qu'on obtient un PILE. Si $p$ est la probabilité de succès, la probabilité de faire $k$ lancers pour obtenir un premier succès est :
$$
\mathbb{P}[k]=p\cdot (1-p)^{k-1}.
$$
Interprétation : $k-1$ échecs de probabilité $1-p$, puis un succès de probabilité $p$.

1) Définir une fonction `geometrique` qui utilise `random.randint` pour calculer combien de lancers de dé à $6$ faces il faut faire pour obtenir le premier $5$.

In [None]:
def geometrique_de():
    nb_tirage = 1
    lancer = random.randint(1,6)
    while lancer != 5:
        nb_tirage += 1
        lancer = random.randint(1,6)
    return nb_tirage

2) En utilisant un dictionnaire, écrire une fonction `frequence_geo` qui prend en paramètre un entier $n$ et fait $n$ tirages. Ces tirages peuvent donner plusieurs résultats : $1,\ 2, \ldots$ La fonction `frequence_geo` génère un dictionnaire associant à chaque résultat sa fréquence.

In [None]:
def frequence_geo(n):
    d = dict()
    for i in range(n):
        t = geometrique_de()
        if t not in d:
            d[t] = 1
        else:
            d[t] += 1
            
    somme = sum(d.values())
    d_freq = dict()
    for k in d:
        d_freq[k] = (d[k]/somme)
    return d_freq

3) On voudrait que notre fonction qui génère un dictionnaire de fréquence ne soit pas spécifique à une fonction de tirage. Ecrire une fonction `frequence_tirage` qui prend deux paramètres : la fonction qui fait un tirage et le nombre de tirage.

In [None]:
def frequence_tirage(tirage,n):
    d = dict()
    for i in range(n):
        t = tirage()
        if t not in d:
            d[t] = 1
        else:
            d[t] += 1
            
    somme = sum(d.values())
    d_freq = dict()
    for k in d:
        d_freq[k] = (d[k]/somme)
    return d_freq

4) Quelle est l'espérance estimée ?

In [None]:
d = frequence_tirage(geometrique_de,10000)
moyenne = 0
for k,v in d.items():
    moyenne += k*v
print(moyenne)

L'espérance d'une loi géométrique est $\frac{1}{p}$. Ici, la chance de succès (obtenir un $5$) est $p=\frac{1}{6}$. On retrouve bien une valeur proche de $6$ expérimentalement.

**Exercice 3 :** une loi de Poisson permet de représenter des évènements rares. On tire un entier naturel aléatoirement. Pour la loi de Poisson de paramètre $\lambda\geq 0$, la probabilité d'obtenir $k$ est :
$$
\mathbb{P}[k] = \frac{\lambda^k}{k!} e^{-\lambda}
$$

1) Définir une fonction `Poisson` qui prend un paramètre $p\in]0,1]$. Cette fonction tire des flottants aléatoires entre $0$ et $1$ jusqu'à ce que le produit de ceux déjà tirés soit inférieur à un paramètre $p$. La fonction renvoie le nombre de flottants tirés. Plus formellement, on tire donc une séquence $u_1, u_2, \ldots$ et on renvoie le plus petit $k$ tel que :
$$
\prod\limits_{i=1}^k{u_i} \leq p
$$

In [None]:
def Poisson(p):
    u=1
    n=0
    while u>p:
        u=u*random.random()
        n+=1
    return n

2) Utiliser la fonction `frequence_tirage` de l'exercice précédent avec pour fonction de tirage la loi de `Poisson` de paramètre $1/e$. 


**Remarque :** pour définir une fonction en une ligne, on peut utiliser une lambda fonction. `f = lambda x : x**2` définit la fonction $f:x\mapsto x^2$.

Vous devriez retrouver la loi de Poisson de paramètre $\lambda=1$ (vous pouvez multiplier les fréquences par $e$ pour mieux lire les valeurs).

In [None]:
import math

def tirage():
    return Poisson(1/math.e)

d = frequence_tirage(tirage,1000000)
#d = frequence_tirage(lambda : Poisson(1/math.e),1000000) #avec une lambda fonction

for k,v in sorted(d.items()):
    print("P[X="+str(k)+"]*e="+str(v*math.e))

On devrait bien obtenir $\mathbb{P}[X=k]\cdot e = \frac{1}{k!}$.

## 4) Utilisation du module scypy

Lorsque l'on fait des mathématiques sur machine, une difficulté importante est que les calculs sont approchés. On a notamment utilisé `math.isclose`. 

Une solution plus propre consiste à faire du *calcul formel*, aussi appelé *calcul symbolique*. Les valeurs sont représentées de manière exactes. Par exemple, la fraction $\frac{1}{3}$ n'est pas simplifiée en $0.333\ldots3$. On peut manipuler des objets plus complexes, tels que des polynômes, en les sommant, les dérivants, etc...

La documentation est disponible en suivant ce <a href="https://docs.sympy.org/latest/index.html">lien</a>.

In [None]:
%pip install sympy
import sympy

Vous pouvez définir des symboles.

In [None]:
x = sympy.symbols('x')
y = sympy.symbols('y')

Puis définir des expressions : 

In [None]:
expr1 = x**2 + x + 1
print(expr1)
expr2 = x**2 -x*y
print(expr2)

On peut faire les opérations classiques :

In [None]:
fact_expr2 = sympy.factor(expr2)
print(fact_expr2)
print(sympy.expand(fact_expr2))

**Exercice :** à l'aide de la documentation, cherchez comment résoudre les problèmes suivants.

1) Calculez les racines du polynôme $X^2-X-1$ et de $2X^3-X^2+7X+2$.

In [None]:
P = x**2-x-1
sympy.roots(P,x)

In [None]:
Q = 2*x**3-x**2+7*x+2
sympy.roots(Q,x)

2) Décomposer la fraction rationelle suivante :
$$
\frac{X^2+3X+1}{(X-1)^2(X-2)}
$$

In [None]:
P = x**2+3*x+1
Q = x**3-4*x**2+5*x-2
sympy.apart(P/Q)

3) On reprend une question que le module `math` ne nous avait pas permis de résoudre proprement. On voulait vérifier que :
$$
\log(n!) \sim n \log(n)
$$
En utilisant `sympy` vous devriez mieux vous en sortir.

In [None]:
expr = sympy.log(sympy.factorial(x))/(x*sympy.log(x))
sympy.limit(expr,x,sympy.oo)

4) Vérifier l'identité suivante :
$$
\forall x\in \mathbb{R}, \frac{[1+\sin(x)]^2+[1-\sin(x)]^2}{2\cos(x)^2} = \frac{1+\sin(x)^2}{1-\sin(x)^2} 
$$

In [None]:
expr = ((1+sympy.sin(x))**2+(1-sympy.sin(x))**2)/(2*sympy.cos(x)**2)-(1+sympy.sin(x)**2)/(1-sympy.sin(x)**2)
sympy.trigsimp(expr)

## 5) Exercice complémentaire

On reprend l'exercice de partie 2 sur la formule de Stirling.

i) On définit la fonction Gamma d'Euler :
$$
\begin{array}{ccc}
\Gamma : & \mathbb{R_+^*} & \rightarrow & \mathbb{\mathbb{R}} \\
         & x              & \mapsto     & \int_{0}^{+\infty}{t^{x-1}e^{-t}dt}
\end{array}
$$
Que vaut $\Gamma\left(\frac{1}{2}\right)^2$ ? **Ne cherchez pas à calculer d'intégrale et rappelez vous l'objectif du TD**.

In [None]:
assert(math.isclose(math.gamma(0.5)**2,math.pi,abs_tol=0.001,rel_tol=0.001))

ii) Vérifier que :
$$
\Gamma(x+1) \sim_{+\infty} \sqrt{2\pi x} \left( \frac{x}{e} \right)^x
$$

Pour se convaincre de l'équivalence sur les réels, on va tester sur des flottants pris aléatoirement, en incrémentant une variable $x$ progressivement d'un flottant aléatoire entre $0$ et $1$. On répète cette opération tant qu'il n'y a pas de dépassement et on rattrape l'exception afin d'arrêter la boucle.

In [None]:
def stirling_continue(x):
    return math.sqrt(2*math.pi*x)*math.pow(x/math.e,x)

depassement = False
monotone = True
x=1
ancien_quotient = math.inf
while not depassement and monotone:
    try:
        quotient = math.gamma(x+1)/stirling(x)
        if ancien_quotient<quotient:
            print("quotient non monotone")
            monotone = False
        else:
            ancien_quotient = quotient
            x += random.random()
    except OverflowError:
        depassement = True
        
print(quotient)

iii) On peut prolonger la fonction $\Gamma$ aux nombres complexes de partie réelles strictement positives. On va donc manipuler des nombres complexes.

En Python, le type `complex` existe déjà. On peut définir des complexes de plusieurs manières :

In [None]:
z = complex(1,3)
z = 1+3j
print(z)

Pour rappel, les complexes ont deux représentations classiques :
- Algébrique : $a + i\cdot b$ avec $a,b\in\mathbb{R}$. On stocke $a$ (partie réelle) et $b$ (partie imaginaire). C'est la représentation utilisée en Python.
- Polaire : $r\cdot e^{i \Theta}$, avec $r\in\mathbb{R_+},\Theta\in]-\pi,\pi]$. On stocke $r$ (rayon) et $\Theta$ (argument).

Ecrire deux fonctions de conversion d'une représentation vers l'autre. N'utilisez aucun module.

In [None]:
def polar(z):
    r = math.sqrt(z.real**2+z.imag**2)
    theta = math.copysign(1,z.imag)*math.acos(z.real/r)
    return (r,theta)

assert(polar(-1-1j)[0]==math.sqrt(2))
assert(polar(-1-1j)[1]==-3*math.pi/4)

In [None]:
def algebrique(r,theta):
    return complex(r*math.cos(theta),r*math.sin(theta))

assert(algebrique(*polar(1))==1) #l'étoile transforme le couple en deux paramètres
assert(math.isclose(algebrique(*polar(1j)).real,0,abs_tol=0.001)) #valeur approchée
assert(math.isclose(algebrique(*polar(1j)).imag,1,abs_tol=0.001))

iv) Vérifier expérimentalement, en générant des nombres complexes aléatoires, la correction de vos fonctions à partir du module `cmath` (équivalent de `math` pour les complexes). La documentation de ce module : <a href="https://docs.python.org/3/library/cmath.html#module-cmath">lien</a>.

In [None]:
import cmath

nb_test = 1000
max = 100
#tests polar
for i in range(nb_test):
    z = complex(random.uniform(-max,max),random.uniform(-max,max))
    assert(math.isclose(polar(z)[0],cmath.polar(z)[0],abs_tol=0.001))
    assert(math.isclose(polar(z)[1],cmath.polar(z)[1],abs_tol=0.001))
    
#tests algebrique
for i in range(nb_test):
    r = random.uniform(0,max)
    theta = random.uniform(-math.pi,math.pi)
    assert(cmath.isclose(algebrique(r,theta),cmath.rect(r,theta),abs_tol=0.001)) #on utilise cmath.isclose

v) Vérifiez expérimentalement, en générant des nombres complexes aléatoires, que :
$$
\forall z\in \mathbb{C}\backslash\mathbb{N}, Réel(z)>0 \Rightarrow \Gamma(z)\cdot \Gamma(1-z) = \frac{\pi}{\sin(z\pi)}
$$

Vous remarquez rapidement que la fonction gamma sur les complexes n'est pas disponible dans le module `cmath`. Une petite recherche en ligne vous suggère d'utiliser `scipy.special`.

In [None]:
%pip install scipy 
import scipy.special

In [None]:
nb_test = 1000
max = 100
for i in range(nb_test):
    z = complex(random.uniform(0,max),random.uniform(-max,max))
    if z != math.floor(z.real): # si z n'est pas un entier
        a = scipy.special.gamma(z)*scipy.special.gamma(1-z)
        b = math.pi/cmath.sin(math.pi*z)
        assert(cmath.isclose(a,b))

**Remarque :** le module `sympy` connait cette simplification :

In [None]:
z = sympy.symbols('z')
sympy.gammasimp(sympy.gamma(z)*sympy.gamma(1-z))