# La gestion des modules en Python

## Module ou *package* ?

**Module :** fichier qui regroupe plusieurs fonctions.

**Package :** répertoire qui rassemble plusieurs modules.

Dans [le précédent *notebook*](1.allocine-get-movies-id.ipynb#Optimiser), nous avons déplacé une fonction dans un fichier séparé intitulé `utils.py`. Par cette simple opération, nous avons créé un module qu’il est possible d’importer dans un script avec la commande `import` plus le nom du fichier sans l’extension :

In [None]:
import utils

**Comment ça ?!** `ModuleNotFoundError` ?

Python a raison, il s’attendait à trouver un fichier `utils.py` au même niveau que ce *notebook*, c’est-à-dire dans le même répertoire, alors qu’il est rangé dans un sous-dossier `scrape`.

Ce sous-dossier `scrape` est ce que l’on appelle un *package* et un *package* peut renfermer plusieurs modules.

## Importations et espaces de nommage

Avant tout, un package dispose d’un nom. Et c’est par ce nom qu’il sera appelé par python :

In [None]:
import scrape

On pourrait supposer que cette commande donne accès à tous les modules qui dépendent de `scrape` mais, en l’état, aucune possibilité d’accéder à la fonction `get_html_from_url()` définie dans `utils` :

In [None]:
# All these commands fail
# html = get_html_from_url('http://www.llf.cnrs.fr/')
# html =utils.get_html_from_url('http://www.llf.cnrs.fr/')
# html = scrape.utils.get_html_from_url('http://www.llf.cnrs.fr/')

Une solution consiste à importer directement le module `utils` du *package* `scrape` :

In [None]:
import scrape.utils

Puis à appeler la fonction en passant par tous les espaces de nommage :

In [None]:
html = scrape.utils.get_html_from_url('http://www.llf.cnrs.fr/')

### Alias

Plutôt fastidieux d’appeler une fonction d’aussi loin, non ? Heureusement, il existe les alias :

In [None]:
import scrape.utils as sc
html = sc.get_html_from_url('http://www.llf.cnrs.fr/')

### Importation complète

On peut aussi accéder directement aux fonctions sans les espaces de nommage :

In [None]:
from scrape.utils import *
html = get_html_from_url('http://www.llf.cnrs.fr/')

### Importation spécifique

L’importation totale des fonctions d’un module présente deux risques :
- charger des fonctions inutiles pour le script en cours ;
- l’étoile `*` masque le nom des fonctions.

Une autre méthode consiste à puiser une fonction spécifique dans un module :

In [None]:
from scrape.utils import get_html_from_url
html = get_html_from_url('http://www.llf.cnrs.fr/')

## Organiser son *package*

Dans la pratique, on préférera toujours conserver dans la syntaxe d’appel aux fonctions utilisateur le lien de dépendance à un espace de nommage (module) :

In [None]:
from scrape import utils
html = utils.get_html_from_url('http://www.llf.cnrs.fr/')

De cette manière, si l’on définissait dans un module une fonction qui porte le même nom qu’une autre fonction d’un autre module, on éviterait tout risque de collision.

### Des fichiers thématiques

Un *package* s’organise autour de fichiers regroupant des fonctions qui servent elles-mêmes un objectif commun. On peut imaginer des modules avec des noms comme : `core`, `utils`, `tests`, `data`…

### Un sommaire pour le *package*

Il existe un fichier un peu particulier que l’on a coutume de placer en-tête de tout *package*, et ce même s’il est devenu optionnel avec les mises à jour successives de python : `__init__.py`

Ce fichier est utilisé à l’initialisation du paquet et peut se concevoir comme un sommaire du contenu. Il est chargé de lister l’ensemble des modules qu’il contient.

Créez un fichier `__init__.py` à la racine du répertoire `scrape` avec juste ces quelques lignes :
```py
__name__ = 'Scrape: the Web-corpus maker'
__version__ = 'v1.0b'

from .utils import get_html_from_url
```

Ce qui permet ensuite de raccourcir les appels aux fonctions de tous les modules dépendants, comme s’il s’agissait de méthodes du *package* :

In [None]:
import scrape
html = scrape.get_html_from_url('http://www.llf.cnrs.fr/')