<br>
<div align="right">Enseignant : Aric Wizenberg</div>
<div align="right">E-mail : icarwiz@yahoo.fr</div>
<div align="right">Année : 2018/2019</div><br><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:32px;color:darkgreen">Master 2 MASERATI - Cours de Python</span></div><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:24px;color:#e60000">Modules et bibliothèques</span></div><br><br>
<hr>

# Fonctions et classe natives

Le coeur de Python, chargé par défaut, dispose d'un nombre très limité de fonctions natives, moins d'une centaine. Nous en avons déjà vu quelques-unes (print, type, len, input...)

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/functions.html> Fonctions natives de Python </a></div>

De même il y a un nombre limité de classes et types natifs.

Mais il existe en réalité un nombre immense de fonctions et de classes crées par les concepteurs de Python ou par des tiers...

Les **bibliothèques** (plus couramment nommées **modules** en Python) sont des ensembles de fonctions, de constantes et de classes qu'on peut utiliser dans son code à deux conditions :
1. que les modules soient **préalablement installés** sur l'ordinateur qui exécute le code
2. que les modules soient **importés** (chargés en mémoire, dans le Kernel) dans le code, avant de les utiliser

# Charger un module

Il y a deux moyens possibles d'**importer** de nouveaux éléments, donc de les charger en **mémoire** (nécessaire au fait d'en rendre possible l'utilisation).

## Par import du module complet

En utilisant la commande :
```python
import nom_module
```

Tous les composants de la bibliothèque sont alors accessible en utilisant la formulation :
```python
nom_module.nom_fonction() 

```
ou 
```python
nom_module.NomClasse
```

Par exemple, la bibliothèque **os** de Python permet d'utiliser des commandes en lien avec le système d'exploitation (Operating System en anglais), comme par exemple : exécuter un programme, parcourir le disque dur...

Supposons que je veuille utiliser la fonction **listdir** contenue du module **os** qui permet d'obtenir la liste des fichiers dans un dossier (par défaut celui où se trouve le Notebook). Il suffit de faire :

In [1]:
import os

Après exécution de cette cellule (et tant que le Kernel n'est pas redémarré), on peut accéder aux fonctions et classes de ce module :

In [2]:
os.listdir()[:10]

['.ipynb_checkpoints',
 'B.1.1_Installation_HTML.ipynb',
 'B.1.1_Installation_NB.ipynb',
 'B.1.2_ComposantsBase.ipynb',
 'B.1.3_Notebook.ipynb',
 'B.2.1_Bases.ipynb',
 'B.2.2.1_Nombres.ipynb',
 'B.2.2.2_Variables.ipynb',
 'B.2.2.3_Strings.ipynb',
 'B.2.2.4_Ensembles.ipynb']

On peut aussi ajouter un module entier en lui donnant un **alias**, par exemple on importe souvent la bibliothèque **numpy** qui permet d'utiliser un grand nombre de fonctions de calculs mathématiques en lui donnant l'abréviation *np* grâce au mot-clé **as**

In [3]:
import numpy as np

In [4]:
np.pi

3.141592653589793

## Par import d'un élément spécifique

On peut aussi importer un ou plusieurs éléments spécifiques (au lieu d'importer tout le module) en utilisant la commande :
```python
from nom_module import nom_fonction
```
ou
```python
from nom_module import nom_fonction1, nom_fonction2
```

In [5]:
from os import listdir

In [6]:
listdir()[:10]

['.ipynb_checkpoints',
 'B.1.1_Installation_HTML.ipynb',
 'B.1.1_Installation_NB.ipynb',
 'B.1.2_ComposantsBase.ipynb',
 'B.1.3_Notebook.ipynb',
 'B.2.1_Bases.ipynb',
 'B.2.2.1_Nombres.ipynb',
 'B.2.2.2_Variables.ipynb',
 'B.2.2.3_Strings.ipynb',
 'B.2.2.4_Ensembles.ipynb']

In [7]:
from numpy import pi

In [8]:
2*pi

6.283185307179586

Les fonctions et modules peuvent aussi se voir assigner un alias en rajoutant l'instruction **as** après le nom :

In [9]:
from os import listdir as ld

In [10]:
ld()[:10]

['.ipynb_checkpoints',
 'B.1.1_Installation_HTML.ipynb',
 'B.1.1_Installation_NB.ipynb',
 'B.1.2_ComposantsBase.ipynb',
 'B.1.3_Notebook.ipynb',
 'B.2.1_Bases.ipynb',
 'B.2.2.1_Nombres.ipynb',
 'B.2.2.2_Variables.ipynb',
 'B.2.2.3_Strings.ipynb',
 'B.2.2.4_Ensembles.ipynb']

## Quand utiliser quoi ?

Lorsque vous savez que vous n'utiliserez que quelques éléments d'un module, il est préférable d'importer ces éléments en utilisant **from**.

Lorsque vous utilisez un nombre plus importants d'éléments d'un module, il est préférable d'importer le module complet, si nécessaire en lui donnant un alias.

Sachez qu'**en termes d'utilisation de la mémoire, ça ne change absolument rien**.

# Modules de la bibliothèque standard

Il existe un nombre important de modules, qui sont systématiquement installés avec Python (et donc, a fortiori, avec Anaconda), mais qui ne sont pas chargés en permanence en mémoire (et ne sont donc pas utilisable sans import) : **datetime**, **os**, **random**...

La plupart des modules ne seront pas évoqués ici...

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> 

<a href=https://docs.python.org/3/library/index.html> Doc officielle de Python sur la <b>bibliothèque standard</b></a>

<a href=https://docs.python.org/3/py-modindex.html> Liste de l'ensemble des modules de la <b>bibliothèque standard</b> de Python</a>
</div>

## Module datetime

### Bases

Le module **datetime** permet de gérer toutes les questions relatives aux objets permettant de manipuler les dates

In [11]:
import datetime as dt

In [12]:
dir(dt)

['MAXYEAR',
 'MINYEAR',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'date',
 'datetime',
 'datetime_CAPI',
 'sys',
 'time',
 'timedelta',
 'timezone',
 'tzinfo']

le module **datetime** dispose de trois classes de base :
- **date** qui est la classe permettant de gérer une date
- **time** qui est la classe permettant de gérer une heure de la journée
- **datetime** qui est la classe permettant de gérer un ensemble formé par une date et une heure

### Obtenir la date actuelle

In [13]:
dt.date.today()

datetime.date(2019, 1, 17)

In [14]:
dtnow = dt.datetime.now()
dtnow

datetime.datetime(2019, 1, 17, 9, 49, 51, 245751)

L'objet renvoyé par cette fonction est un objet de type **datetime**

In [17]:
type(dtnow)

datetime.datetime

Les principaux attributs d'un objet datetime sont les suivants :

In [16]:
dtnow.year, dtnow.month, dtnow.day, dtnow.hour, dtnow.minute, dtnow.second, dtnow.microsecond

(2019, 1, 17, 9, 49, 51, 245751)

### Faire des opérations sur les objets datetime

Il est aussi possible de faire des opérations différentielles sur les dates en utilisant la classe **timedelta**

**timedelta** est une **différence entre 2 périodes de temps**

In [18]:
mon_diff_temps = dt.timedelta(hours=20)

On peut alors additionner ou soustraire un **datetime** et un **timedelta**

In [19]:
print(dtnow + mon_diff_temps)
print(dtnow - mon_diff_temps)

2019-01-18 05:49:51.245751
2019-01-16 13:49:51.245751


### Transformations entre chaines de caractères et objets datetime

Pour créer un objet datetime depuis une chaine de caractères, il faut utiliser la méthode **datetime.datetime.strptime()** (comme **string parse time**) et fournir le format de la date avec des spécificateurs particuliers.

In [20]:
ma_date = dt.datetime.strptime('08/08/18 22:33', '%d/%m/%y %H:%M')

La fonction inverse est **strftime** (comme **string format time**), qui fonctionne de manière similaire :

In [21]:
ma_date.strftime('%y_%m_%d_%H_%M')

'18_08_08_22_33'

### Module calendar

Ce module permet d'utiliser des fonctions supplémentaires en lien avec le calendrier annuel

---

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b><br> 
<a href=https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior> Liste complète des <b>spécificateurs de date</b></a><br>
<a href=https://docs.python.org/3/library/datetime.html> Doc officielle de Python sur le <b>module datetime</b></a><br>
<a href=https://docs.python.org/3/library/calendar.html> Doc officielle de Python sur le <b>module calendar</b></a>
</div>

## Autres modules en vrac

### Module collections

Permet d'utiliser des types de base en versions améliorées :
- OrderedDict : un type similaire au **dict** mais qui ont l'avantage d'avoir leurs clés ordonnées.
- namedtuple : un type permet d'utiliser des **tuple** dont les éléments sont nommés.
- deque : un type permettant de manipuler des **files** ou **piles**.

Et d'autres...

*-Files : comme au supermarché, piles comme la pile quand on fait le menage. Question de choses, de en quel moment sortent, le premier et le dernier.-*-

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/collections.html> Doc officielle de Python sur le <b>module collections</b></a></div>

### Module itertools

Permet d'utiliser des itérateurs. C'est-à-dire des structures Certaines fonctions devenues natives en Python sont d'ailleurs historiquement issues de ce module : **zip** et **map**. 

Ce sujet sera brièvement abordé dans la section [Techniques avancées](B.3.5_Avance.ipynb) du cours, que nous étudierons plus tard.

On peut par exemple évoquer :
- Les **cycle**
- Les **permutations**
- Les **combinations**
- Les **accumulate**

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/itertools.html> Doc officielle de Python sur le <b>module itertools</b></a></div>

### Module zipfile et autres modules de compression

C'est un module qui permet d'accéder et de travailler avec les fichiers ZIP.

On peut aussi citer les modules suivants, traitant d'autres formats de compression : gzip, bz2, lzma...

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/zipfile.html> Doc officielle de Python sur le <b>module zipfile</b></a></div>

### Module tkinter

C'est le module standard de Python pour faire des **GUI** (Graphical User Interface), ce que vous appelez couramment (et abusivement) un programme. Le GUI est la partie émergée de l'iceberg qu'est un programme : s'agit de tout ce qui permettra de faire une interface avec des fenêtres, des boutons, des boites de dialogue, etc.

Normalement on n'utilise jamais tkinter lorsque l'on programme sur Notebook étant donné que Notebook est en soi une sorte de GUI pré-implémenté.

Il existe d'autre modules externes permettant de créer des GUI (wxpython par exemple).

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/tkinter.html> Doc officielle de Python sur le <b>module tkinter</b></a></div>

### Modules os, shutil, sys

Il s'agit des modules en lien avec l'ordinateur lui-même. Ils permettent par exemple d'obtenir toutes les fonctions pour faciliter l'exploitation du disque dur

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b><br> 
<a href=https://docs.python.org/3/library/os.html> Doc officielle de Python sur le <b>module os</b></a><br>
<a href=https://docs.python.org/3/library/shutil.html> Doc officielle de Python sur le <b>module shutil</b></a><br>
<a href=https://docs.python.org/3/library/sys.html> Doc officielle de Python sur le <b>module sys</b></a>
</div>

### Modules random, math, array, statistics

Ce sont les modules permettant de travailler avec outils mathématiques ou statistiques

**random** est la bibliothèque permettant de générer aléatoirement des nombres ou modalités. Mais on utilisera plutôt le sous-module **random** du module **numpy**, ses fonctions sont des versions améliorées.

Il existe aussi d'autres modules de la bibliothèque standard comme **math**, **array**, **statistics**, pour lesquels là aussi, nous préfèrerons généralement utiliser **numpy** (ou **scipy**) qui seront présentés dans la suite de ce cours.

### Module re

**re** est un module qui permet d'utiliser les **regular expressions**, un outil très puissant permettant de trouver des chaines de caractères basées sur des patterns.

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://www.datacamp.com/community/tutorials/python-regular-expression-tutorial> Tutorial sur les <b>regular expressions et le module re</b></a></div>

### Module configparser

**configparser** permet de traiter les fichiers de configuration **ini**, ce qui est très utile

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/configparser.html> Doc officielle de Python sur le <b>module configparser</b></a></div>

# Modules d'autres bibliothèques 

Il existe en plus un nombre très important et croissant de modules créées en dehors de la bibliothèque standard, ils ont chacun leur documentation. 

Ces modules **nécessitent d'être installées une première fois** si l'on n'a installé que le coeur de Python...

Mais grâce au fait que vous utilisez une distribution, **Anaconda**, un grand nombre de modules supplémentaires sont déjà installées sur votre ordinateur. Par exemple :

* Pandas : gestion de tables de données

<div class="alert alert-block alert-info"><a href=https://pandas.pydata.org/pandas-docs/stable/>Doc officielle de <b>Pandas</b></a></div>

* Numpy : fonctions et objets de calcul numérique (calculs matriciels et objets matrices par exemple)

<div class="alert alert-block alert-info"><a href=https://docs.scipy.org/doc/numpy/>Doc officielle de <b>Numpy</b></a></div>


* Scipy : fonctions et objets scientifique (fonctions statistiques complexes par exemple)

<div class="alert alert-block alert-info"><a href=https://docs.scipy.org/doc/scipy/reference/>Doc officielle de <b>Scipy</b></a></div>


* Matplotlib : fonctions d'affichage de graphiques

<div class="alert alert-block alert-info"><a href=https://matplotlib.org/users/index.html>Doc officielle de <b>Matplotlib</b></a></div>


* Sklearn : fonctions en rapport avec le Machine Learning, biblio de référence de tous les trucs du Data Scientist moderne

<div class="alert alert-block alert-info"><a href=http://scikit-learn.org/stable/>Doc officielle de <b>Sklearn</b></a></div>


* Statsmodels : fonctions en rapport avec l'économétrie

<div class="alert alert-block alert-info"><a href=https://www.statsmodels.org/stable/index.html>Doc officielle de <b>StatsModels</b></a></div>


---

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.anaconda.com/anaconda/packages/py3.6_win-64.html>La liste de l'ensemble des modules installés par défaut avec Anaconda</a><br> (seules les case cochées correspondent à des modules déjà installés)</div>


Si vous voulez utiliser des modules qui ne sont pas installés par défaut avec Anaconda, il faudra les installer une première fois (et les réinstaller en cas de nouvelle installation d'Anaconda) vous-même en utilisant **conda** ou **pip** (cf. [Installer les extensions en utilisant la ligne de commande](X.1_Annexes.ipynb#Installer-les-extensions-en-utilisant-la-ligne-de-commande)).

C'est d'ailleurs ce qui a été fait avec le module **jupyter_nbcontrib_nbextensions** lorsque vous avez installé Anaconda en début de cours

# Modules personnels

On peut très facilement créer soi-même des modules. Et c'est d'ailleurs recommandé : dans le cadre de votre activité vous allez vous-même créer vos propres fonctions et classes qui vous seront utiles dans le cadre de plusieurs Notebook. 

C'est un peu comme si un bricoleur se construisait ses propres outils.

## Modules simples

Tout fichier avec une extension **.py** contenu dans le même dossier que le fichier de travail (en l'occurence le présent Notebook) peut être importé en utilisant les instructions précédemment évoquées (import, from, as) et le nom du fichier.

Essayons avec la fonction ***liste_vols_vers_liste*** et , en créant un fichier transport.py qui contient leur définition.

Après, essayons de les importer, puis de les utiliser:

In [23]:
import transport as trsp

mes_donnees = [
    'CDG;NTE;Air France',
    'TLS;NTE;Air France',
]

trsp.liste_vols_vers_liste(mes_donnees)

# Le fichier transport.py était en C:\Users\lucia\PyBooks\PyParis_XII_M2\cours\modules, on le copie et le colle en C:\Users\lucia\PyBooks\PyParis_XII_M2\cours\
# Doit être là.


[['CDG', 'NTE', 'Air France'], ['TLS', 'NTE', 'Air France']]

## Modules avec sous-modules

On peut aussi très facilement construire des architectures plus complexes de modules contenant des sous-modules.

Pour cela, il suffit d'organiser ainsi les fichiers sur le disque dur :

***Dossier_de_travail***
>***sous_dossier*** &emsp;&emsp;&emsp;&emsp;&emsp;(sous-dossier qui servira de nom de module de base)
>>*\_\_init\_\_.py* &emsp;&emsp;&emsp;(fichier vide, ne servant qu'à indiquer à Python que sous_dossier est un module parent)
>>
>>*sous_module.py* &emsp;(fichier servant de sous-module)
>
>*fichier_actuel.ipynb* &emsp;&emsp;&emsp;(fichier dans lequel on souhaite importer les modules et sous-modules, ça peut être indifférement un .py ou un .ipynb)

Par exemple, ici, créons l'architecture suivante :

***cours***
>***modpers***
>>*\_\_init\_\_.py*
>>
>>*transport.py*
>
>*B.3.2_Modules.ipynb*

In [None]:
import modpers.transport as trsp

mes_donnees = [
    'CDG;NTE;Air France',
    'TLS;NTE;Air France',
]

trsp.liste_vols_vers_liste(mes_donnees)

## Ré-import de modules

<div class="alert alert-block alert-success"><b>Attention :</b>

La fonction **import** d'un élément spécifique (module / objet / fonction) ne fonctionne qu'une fois par session du Kernel, si vous réexuctez cete même instruction une deuxième fois, Python n'essaiera même pas de refaire l'import.

Donc, si vous modifiez votre module entre-temps, relancer l'instruction import ne mettra pas à jour votre module dans la session courante du Kernel.
</div>

Pour mettre à jour un module que vous avez déjà chargé, mais que vous avez modifié entre temps, il existe en revanche une astuce : utiliser la fonction reload du module standard **importlib**

In [None]:
from importlib import reload
reload(bib)

# Vérification de version d'un module

On peut vérifier la version d'un module ainsi :

In [None]:
np.__version__

Mais cela ne fonctionne pas avec les modules de la bibliothèque standard qui n'ont pas de version propre, ils sont de la même version que l'installation de Python. On peut afficher la version de Python ainsi :

In [None]:
import sys
sys.version