## Bibliothèques, imports, fonctions

![image](resources/imports.png)

(Récupéré sur [xkcd](www.xkcd.com), le site de _Randall Munroe_. Vous noterez l'emploi 'archaïque' de la fonction print !)

### Importer des modules (bibliothèques de fonctions)

#### Généralités

Python contient une immense liste de _bibliothèques_, qui sont en fait des paquets contenant de nombreuses fonctions utiles. Vous l'aurez remarqué, Python ne permet pas de faire grand-chose par lui-même, et ce _minimalisme_ est un choix délibéré. Dans ce chapitre, nous allons voir comment _importer_ ces bibliothèques (également appelés _modules_) pour utiliser leurs fonctions. Nous allons nous pencher sur un cas bien connu,  

Il existe donc des librairies effectuant des tâches assez _élémentaires_

* la gestion d'_expressions régulières_ ([re](https://docs.python.org/fr/3/library/re.html))
* l'interaction avec l'ordinateur ([os](https://docs.python.org/fr/3/library/os.html))
* la recherche de fichiers _via_ des expressions régulières, encore ([glob](https://docs.python.org/3/library/glob.html))
* les fonctions mathématiques ([NumPy](https://numpy.org/))
* la gestion des fichiers Image simples ([PIL](https://he-arc.github.io/livre-python/pillow/index.html))

Mais également des librairies plus costaudes qui ont des fonctionnalités plus avancées !

* le traitement d'images et la _machine vision_ ([OpenCV](https://opencv.org/) ou [Scikit-Image](https://scikit-image.org/))
* la gestion des fichiers image _bio-formats_ ([PIMS](http://soft-matter.github.io/pims/v0.6.1/))
* le traitement de signal, la résolution numérique d'équations ([SciPy](https://scipy.org/))
* l'import et export de données dans un format _tableur_ avancé, ([Pandas](https://pandas.pydata.org/))
* l'affichage de graphiques ([MatPlotLib](https://matplotlib.org) ou [Bokeh](https://bokeh.org))
* l'apprentissage statistique et non supervisé ([TensorFlow](https://www.tensorflow.org/learn?hl=fr) ou [Pytorch](https://pytorch.org/))

#### Syntaxe

Importer un module `X` est on ne peut plus simple. Si celui-ci est déjà installé dans Python, on peut alors l'invoquer avec la commande `import X`. 

Supposons que je veuille importer le module `numpy` et que je veuille ensuite utiliser la fonction cosinus `cos()` de NumPy. Pour appeler une fonction existant dans le module `numpy`, on va donc écrire `numpy.fonction()`, et cette syntaxe est similaire à celle des méthodes pour les objets en Python ([cf. Leçon n°2](./Tutorial_2_ListsTuplesDicts.ipynb)). Mais, comme ici `numpy` est une bibliothèque, et non un `str` ou une `liste`, on parlera quand même de fonction. Mon code devrait alors ressembler à :

In [None]:
import numpy
numpy.cos(pi/3)

Aaaargh ! $\pi$ n'existe pas non plus en Python, ce qui est assez agaçant ! Mais, soyez rassuré, une fois de plus, NumPy va vous aider, car il possède en plus la constante $\pi$, qu'on va trouver en écrivant :

In [None]:
numpy.cos(numpy.pi/3)

Fort bien ! Vous aurez remarqué que je n'ai pas eu besoin de ré-importer le module `numpy` : une fois que celui-ci est chargé dans notre _classeur_ (c'est à dire l'ensemble de nos cellules de Python), il l'est pour de bon ! 

Maintenant, vous vous posez probablement quelques questions : 

1. Est-on condamné à écrire _tout le temps_ `numpy.truc()` à chaque fois qu'on veut utiliser la fonction `truc()` ?
2. Est-ce que je peux simplement importer certaines parties d'un module ?
3. Comment est-ce que je sais ce que contient le module `numpy` ?

#### Donner un _alias_ à vos paquets avec `as` : 

Il est tout à fait possible de renommer un module à l'import, afin d'éviter d'avoir des noms à rallonge. Voyez plutôt : 

In [None]:
import numpy as np # A very classic shorthand for numpy
np.cos(np.pi/3)

#### Importer des parties de modules avec `from`

Les imports de fonctions peuvent prendre du temps et de la place en mémoire, ce qui ralentira l'exécution de vos programmes. Si vous êtes un fana de l'optimisation de code (_on n'en est pas encore là, normalement !_), vous ne souhaiterez importer que le strict nécessaire. Pour `piocher` des fonctions ou des variables (comme $\pi$) dans un module `X`, on peut utiliser le mot-clé `from` combiné à un `import`. Par exemple, pour notre cosinus préféré : 

In [None]:
from numpy import cos, pi
print(cos(pi/3))

Vous pouvez donc lister après import toutes les fonctions qui vous intéressent à importer. Si vous n'êtes pas très subtil, vous pouvez décider d'importer toutes les fonctions d'un module `X` en utilisant la syntaxe suivante : 

In [None]:
from numpy import *
2*(arctan(1/10) + arctan(10))/pi

Cela peut toutefois poser des problèmes, si, par exemple, deux modules ont les mêmes fonctions. Voyez par exemple : 

In [None]:
from numpy import * # Contains sin(), cos(), pi
from math import * # Also contains sin(), cos(), pi

cos(pi/2)


Dans un tel cas, c'est le dernier import qui va _primer_ sur le premier, mais cela n'est pas toujours vrai, comme nous allons le voir plus tard dans ce tutoriel. 

On peut enfin combiner tous nos mots-clés ensemble pour encore plus de flexibilité ... mais attention à ne pas rendre votre code trop confus :-) :


In [None]:
from numpy import cos as bonjour
from numpy import pi as madame
bonjour(madame/3)

#### Dé-référencement : oublier un module en cours de route

Examinons maintenant le code suivant, qui ne devrait _a priori_ pas fonctionner vu qu'on n'a pas effectué d'imports.

In [None]:
print(numpy.cos(numpy.pi/3))
print(np.cos(np.pi/3))
print(cos(pi/3))
print(bonjour(madame/3))


Le résultat de ces lignes de code peuvent vous paraître bizarres, mais rappelez-vous que nous avons déjà écrit plus haut `import numpy` et `import numpy as np`, ce dont notre Python _interactif_ se souvient encore lorsqu'on effectue le troisième import avec `from`. Pour oublier un import, il va falloir redémarrer notre _noyau_ (Kernel) Python en utilisant le bouton suivant de votre interface :

![img](./resources/restart_kernel.png)

Vous pouvez également demander à Python de dé-référencer votre module en utilisant le mot-clé `del` suivi de votre module `X`. Le code suivant n'a donc aucune chance de fonctionner jusqu'au bout. La première fois que vous l'exécuterez, Python va dé-référencer `numpy` et ne pourra plus appeler la fonction `cos`. Les fois suivantes, il ne reconnaîtra même plus le module `numpy` et sera donc incapable de le dé-référencer :

In [None]:
del numpy
print(numpy.cos(10))

_Note_ : Le mot-clé Python [`del`](https://www.w3schools.com/python/python_ref_keywords.asp) fonctionne également sur toutes les variables et tous les objets, son usage est donc très très général. 

#### Connaître les fonctions d'un module

Que contient au juste le module numpy ? Il n'est en effet pas évident de savoir quelles sont les fonctions qu'il contient. Vous vous douterez qu'en plus, NumPy en contient beaucoup. Les bons modules possèdent bien souvent de la documentation, que l'on peut trouver de différentes manières. 

1. Via l'API du site internet du module 

Bien souvent, vous pouvez aller sur le site de votre module (par exemple [ici](https://numpy.org) pour NumPy) et en cliquant un peu, vous tomberez sur l'API, l'interface de programmation du module (_Application Programming Interface_). Le nom est un peu barbare, mais il représente en gros une liste documentée de toutes les fonctions, classes, objets présents dans le module. [L'API de NumPy](https://numpy.org/doc/stable/reference/index.html), comme bien d'autres, possède une barre de recherche qui vous permettra de savoir si, par exemple, la fonction $W$ de Lambert est présente dans le module.

2. Par la documentation du code et les fonctions Python `help` et `dir`

Les modules possèdent généralement une documentation détaillée, hormis pour les plus expérimentaux d'entre eux. On peut demander de l'aide à propos d'un paquet de nombreuses manières différentes. Voyons l'exemple avec un autre module, `Pandas`. Avec la fonction native `help` de Python, on peut lui demander par exemple s'il existe une fonction `pandas.bamboo` ou `pandas.concat`, et dans la foulée, savoir comment elle fonctionne. Si la fonction n'existe pas, le code va renvoyer une erreur, mais si la fonction existe, elle va renvoyer la documentation associée. 


In [None]:
import pandas
help(pandas.bamboo)
dir(pandas)

Contrairement à l'API du site internet d'un module, qui fonctionne comme un moteur de recherche, ici vous devrez déjà avoir une bonne idée du nom de la fonction que vous recherchez pour appeler à l'aide. Si vous n'êtes pas sûr, et que votre connexion internet ne fonctionne pas, vous pourrez toujours essayer l'aide du module lui-même [ `help(pandas)` ] et vous laisser guider, ou utiliser la fonction `dir(pandas)` qui va lister tous les objets (y compris les fonctions) contenus dans le module.

In [None]:
help(pandas)
dir(pandas)

Le fichier d'aide en question est ici _colossal_, donc je ne recommande clairment pas de l'utiliser. En plus de lister les fonctions, la commande `dir`  liste également des _classes_ définies dans le module (vous pouvez voir cela comme des nouveaux types de variables) ainsi que les propriétés par défaut du module, entourés de deux tirets bas '\_\_' qui ont des noms assez explicites : `pandas.__name__` va par exemple renvoyer le nom complet du module Pandas.

3. Directement sur votre éditeur de code _via IntelliSense®_ 

Nombre d'entre vous n'êtes probablement pas fanatiques de Microsoft, mais leur éditeur de code [Visual Studio Code](https://code.visualstudio.com/), disponible pour toutes les plateformes, possède de nombreuses fonctionnalités qui vous simplifieront la vie en Python. En particulier, il permet d'afficher dans une fenêtre d'aide contextuelle toutes les fonctions et sous-modules associées à un module, toutes les méthodes associées à un objet, et affiche dans une fenêtre contextuelle la documentation associée (formatée). Par exemple, si je recherche une fonction pour choisir des nombres au harsard avec NumPy, je peux laisser l'éditeur me prendre par la main. Voyez plutôt :

![img](./resources/intellisense_import.gif)

J'économise donc _beaucoup_ de temps à ne pas ouvrir mon navigateur internet et lire la documentation de fonctionnalités qui ne m'intéressent pas ! Sachez également que ces aides contextuelles fonctionnent pour n'importe quel objet Python, ce qui permet de rapidement savoir, par exemple, quelles sont les méthodes disponibles pour l'objet avec lequel vous travaillez, ou même quels sont les modules que vous pouvez importer dans Python.

Pour l'instant, vous ne parcourez pas ces tutoriels Python avec Visual Studio Code, mais cela peut s'arranger si vous êtes motivés pour [installer Python et VSCode sur votre machine](https://code.visualstudio.com/docs/python/python-tutorial) ! (en anglais) 

##### ICI --> VSCODE

_Note_ : Spyder permet également d'afficher de telles fenêtres contextuelles, mais elles ont l'air légèrement moins performantes que celles de Micro$oft. 



----------------------------------------------

### Faites vos propres fonctions !



#### Pourquoi faire des fonctions ?

Supposons que vous avez régulièrement à exécuter un bout de code qui correspond à une "tâche" bien précise. Par exemple, j'aimerais pouvoir rapidement estimer la viscosité d'une suspension à partir de sa concentration en particules $\phi$, la viscosité du fluide suspendant $\eta_0$ et une valeur de la fraction d'empilement maximal $\phi_{\rm m}$ (correspondant à un coefficient de friction $\mu$ microscopique entre particules, cf. [les papiers de Romain Mari _et al_](https://doi.org/10.1122/1.4890747).). Il existe plusieurs modèles à ce sujet, par exemple le modèle d'Einstein (vrai pour faibles $\phi$) et deux modèles empiriques à plus haut $\phi$, celui de Maron & Pierce et celui de Krieger & Dougherty :

$$
\left \{ \begin{array}{rll} \eta &= \eta_0 \left (1 + \frac{5}{2} \phi \right ) & \text{Einstein} \\ 
                            \eta &= \eta_0 \left (1 - \frac{\phi}{\phi_{\rm m}} \right )^{-2} & \text{Maron-Pierce} \\
                            \eta &= \eta_0 \left (1 - \frac{\phi}{\phi_{\rm m}} \right)^{-2.5 \phi_{\rm m}} &\text{Krieger-Dougherty} \end{array} \right .
$$

Vous vous rendez peut-être compte qu'il sera assez pénible de mettre en place un tel bout de code dans une boucle, et que le résultat sera peu lisible. Une solution est donc de définir une fonction qui va renvoyer $\eta$ quand on lui envoie les bons paramètres. Commençons assez simplement. Une fonction se définit avec le mot-clé `def`, et la syntaxe suivante qui ressemble à celle des boucles et des instructions conditionnelles. Il faut en outre définir ce que la fonction va renvoyer à l'utilisateur, ce qui s'effectue en fin de fonction avec l'instruction `return`. 

In [None]:
def my_function(argument_1, argument_2): # A dummy function
    result = argument_1 + argument_2 
    return result

def krieger_dougherty(phi, phi_m, eta_0): # Krieger-Dougherty model
    return eta_0*(1-phi/phi_m)**(-2.5*phi_m)

krieger_dougherty(0.2,0.64,0.001) # phi = 20 %, phi_max ~ random close packing, eta_0 ~ that of water

#### Types de valeurs en entrée

Il n'y a pas vraiment de type de variables pré-supposé en entrée. On pourrait essayer de donner en entrée une liste, mais rappelez-vous, les objets `list` ne fonctionnent pas bien avec les opérations de base (c'était le [Tutoriel 2](./Tutorial_2_ListsTuplesDicts.ipynb))). On va plutôt utiliser un tableau NumPy pour calculer plusieurs valeurs de $\eta$ à la volée. On peut donc écrire :

In [None]:
import numpy as np
phis = np.array([0.01,0.02,0.05,0.1,0.2,0.5])
phi_ms = np.array([0.64,0.63,0.61,0.63,0.64,0.58])

print(krieger_dougherty(phis, 0.64, 0.001))
print(krieger_dougherty(phis, phi_ms, 0.001))

Merveilleux, non ?


#### Valeurs par défaut

Les fonctions sont très __flexibles__ et permettent de définir des valeurs par défaut pour vos variables. Par exemple, je peux décider que si je ne précise pas $\phi_{\rm m}$ ou la viscosité du solvant $\eta_0$, ils doivent prendre respectivement les valeurs $0.64$ et $1$ (dans ce cas, on obtient la viscosité _relative_ de la suspension). Pour cela, on indique juste `argument = value` dans la ligne où le `def` est présent. On peut toujours 'écraser' ces valeurs lors de l'appel à la fonction :

In [None]:
def krieger_dougherty_mieux(phi, phi_m=0.64, eta_0=1.0):
    return eta_0*(1-phi/phi_m)**(-2.5*phi_m)

print(krieger_dougherty_mieux(0.3))      # Only one argument _needed_
print(krieger_dougherty_mieux(0.3,0.5))  # You can still specify multiple arguments (by default, in the original order)
print(krieger_dougherty_mieux(0.3, eta_0=0.02))

Dans le dernier cas, on a appelé la fonction avec un argument 'sans nom' qui va donc correspondre à $\phi$, alors que nous avons explicitement nommé notre deuxième entrée, qui va donc être 'considérée' correctement comme $\eta_0$. 


#### Fonctions dans les fonctions

Nous avons défini la fonction `krieger_dougherty`, qui est certes sympathique, mais nous aimerions plutôt une fonction `viscosity` qui est capable de donner $\eta$ également en fonction d'un modèle. Eh bien, rien de plus simple. Python étant très modulaire, on peut demander à `viscosity` d'appeler lui-même une autre fonction, par exemple de la manière suivante : 

In [None]:
import numpy as np

def krieger_dougherty(phi, phi_m=0.64, eta_0=1):
    return eta_0*(1-phi/phi_m)**(-2.5*phi_m)

def maron_pierce(phi, phi_m=0.64, eta_0=1):
    return eta_0*(1-phi/phi_m)**(-2)

def viscosity(phi, phi_m=0.70, eta_0=5, model='krieger-dougherty'):
    if model == 'krieger-dougherty' or model == 'krieger':
        return krieger_dougherty(phi, phi_m, eta_0)
    elif model == 'maron-pierce' or model == 'maron':
        return maron_pierce(phi, phi_m, eta_0)
    else:
        print('Unknown model')
        return np.nan

viscosity(0.3)
viscosity(0.3, model='maron-pierce')

Ici, les valeurs par défaut de $\phi_{\rm m}$ et de $\eta_0$ de `viscosity` vont _écraser_ celles par défaut des deux fonctions `maron_pierce` et `krieger_dougherty` potentiellement appelées. 

__Exercices__ : 

* Mettez en place la sous-fonction `Einstein` dans la fonction `viscosity`.
* Essayez de définir une fonction _à l'intérieur_ de la définition d'une autre fonction. Cela fonctionne-t-il ? Quelle est la différence avec le fait de ne pas imbriquer les fonctions (indice : essayez d'appeler les sous-fonctions directement depuis l'extérieur de la fonction principale)



#### Portée des variables en Python

Dans de nombreux langages de programmation (C++, MATLAB, Fortran), définir une fonction crée un espace _à part_ où seules les variables précisées en entrée et celles déclarées à l'intérieur de la fonction 'existent'*. En d'autres termes, si je déclare une fonction, celle-ci n'est pas capable d'appeler une variable qui existe 'en dehors' de la fonction. Essayons d'examiner le problème en Python :

<sub>(*Les petits malins savent qu'il est parfois possible de s'en sortir en déclarant des variables globales en utilisant le mot-clé `global` dans la déclaration de leur variable.)<sub>

In [None]:
def maron_pierce_new(phi, eta_0=1):
    visco = eta_0*(1-phi/phi_m)**(-2)
    return visco 

phi_m = 0.64
print(maron_pierce_new(0.30))

Python s'est 'débrouillé' : faute d'avoir trouvé un $\phi_m$ à l'intérieur de la fonction, il est allé chercher un $\phi_m$ en dehors, même si celui-ci a été défini _après_ la fonction `maron_pierce_new`. C'est une propriété très puissante de Python, mais également une source de confusion, notamment quand des variables ayant le même nom existent à la fois en dehors et en dedans de la fonction. __Dans ce cas, la valeur déclarée dans la fonction est prioritaire sur celle existant en dehors de la fonction__. Voyez par exemple:

In [1]:
greeting = 'Hey '

def say_hi(name):
    greeting = 'Hello '
    exclamation = ' !'
    return greeting + name + exclamation

print(say_hi('Bob'))
print(greeting)

Hello Bob !
Hey 


Les variables définies à l'intérieur de la fonction restent toutefois bien locales. Essayez par exemple d'appeler `Exclamation` en dehors de la fonction `say_hi`: cela ne fonctionne pas. Ouf, sinon ce serait _vraiment_ le bazar.

---------------------------------------------------------

### Devenez votre propre module

#### Intérêt

Il est possible qu'avec le temps, vous ayez besoin de définir de nombreuses fonctions qui effectuent des opérations assez standards (par exemple, un 'nettoyage' de données brutes, un calcul de fonction de corrélation de paires $g(r)$ pour des milieux divisés avec des particules, ou une détection de contour d'un objet). Cela crée à nouveau des codes très confus avec beaucoup de fonctions déclarées avant de voir des lignes de code. Si les utilisateurs du code n'ont pas besoin de 'toucher' à ces fonctions (c'est à dire de modifier leur fonctionnement en éditant leur code), vous pouvez très bien décider de créer vous même un fichier Python (`.py`) annexe qui contient toutes ces fonctions standards. L'image animée ci-dessous vous montre comment faire cela dans votre environnement actuel.

![img](./resources/save_external_file.gif)

#### Syntaxe

Nous avons créé un fichier Python 'simple' (qui se termine en `.py`) nommé `external_functions` et qui ne contient que des fonctions. L'exécuter sous Python ne ferait rien _a priori_, mais nous pouvons importer ses fonctions très simplement en utilisant la commande `import` ! __Reproduisez ces opérations dans votre environnement, puis essayez d'exécuter le code suivant__ 

In [None]:
import external_functions as fun

print(fun.my_external_function('toto'))

Python a réussi à trouver votre nouveau module extérieur et à utiliser les fonctions qui y sont incluses ! 

#### Lister les propriétés d'un module 

Vous pouvez, si vous êtes un peu tête-en-l'air, demander d'afficher toutes les fonctions associées au module `external_functions` en utilisant la fonction Python native [`dir()`](https://docs.python.org/fr/3.10/library/functions.html#dir) :

In [None]:
import external_functions as fun

dir(fun)

Ici, nous voyons qu'il existe de nombreuses 'fonctions' entourées par deux tirets bas (_underscores_), par exemple \_\_name\_\_, mais après cette liste d'étranges objets, on retrouve bien notre `my_external_function`. Les objets entourés de '\_\_' sont en fait des propriétés _spéciales_ que Python crée par défaut pour tous les modules. Par exemple, `__name__` contient le nom du module en question (sous forme de chaîne de caractères).

In [None]:
fun.__name__

Vous pouvez enfin appeler des modules dans des sous-dossiers du fichier actuel. Si votre fichier `external_functions` est dans un sous-dossier `my_folder` de votre dossier actuel (c'est à dire le dossier dans lequel se trouve le fichier que vous êtes en train de lire). __Créez un sous-dossier et donnez-lui un nom (j'ai choisi `my_folder`), déplacez le fichier `external_functions.py` dans ce sous-dossier, et essayez d'importer votre module en tapant le code suivant__ :

In [None]:
import my_folder.external_functions as fun

Appeler un module dans un sous-dossier revient à écrire son chemin d'accès _relatif_ par rapport au fichier que vous êtes en train de lire actuellement ; la seule différence est que vous devrez utiliser des points `.` au lieu des `\` ou `/` pour séparer les dossiers. Et pour 'remonter' d'un dossier dans votre chemin d'accès relatif, vous pouvez utiliser deux points `..` ! Dans notre cas précis, cela n'est pas très utile car nous sommes déjà dans le dossier 'racine' de notre environnement, mais sachez que la commande existe. 

__Exercice__ : Créez un module nommé `extra_functions`. Créez-y une fonction `my_function`. Faites en sorte que cette fonction renvoie quelque chose (par exemple `'Roger'`) et importez-la en utilisant la commande suivante dans votre code principal :

```
from extra_functions import my_function 
```

Ensuite, créez une fonction `my_function` _dans votre code principal_ et faites en sorte que celle-ci renvoie _autre chose_ (par exemple, `'Jean-Mi'`). Enfin, appelez votre fonction `my_function` et examinez laquelle des deux fonctions _homonymes_ est réellement appelée. Que pensez-vous du résultat ? L'avons-nous déjà rencontré précédemment ou avons-nous déjà rencontré quelque chose de similaire précédemment ?