<center class="mytitle">
**Python avancé**
</center>

# packaging

<center>
<span>**Loic Gouarin**</span>
</center>
<center>
<span>21 et 22 novembre 2017</span>
</center>

### Pourquoi ?

- structuration
- modularité
- portabilité
- diffusion

### Définitions

Il est facile d'étendre les fonctionnalités de Python en créant des modules et/ou des packages.

- un module est un fichier regroupant un ensemble de fonctions, de classes, ...
- un package est un répretoire regroupant un ensemble de modules


## Un module

### Exemple de module

Afin d'illustrer l'utilisation d'un module en Python, nous allons écrire un calculateur qui sait uniquement faire une addition et une soustraction.

Voici le script **calculator.py**.

In [22]:
%%file calculator_mod.py
"""
Calculator module
"""

def add(a, b):
    """
    return a + b
    """
    return a + b

def sub(a, b): 
    """
    return a - b
    """
    return a - b

Writing calculator_mod.py


### Utilisation d'un module

Il existe différentes manières d'importer un module en utilisant le mot-clef **import**.

On peut importer un module via son nom.


In [1]:
import calculator_mod
calculator_mod.add(1, 2)

3

On peut importer une partie d'un module.

In [2]:
from calculator_mod import sub
sub(1, 2)

-1

On peut importer un module en modifiant son nom d'appel.

In [3]:
import calculator_mod as calc
calc.add(1, 2)

3

On peut importer l'ensemble du module.

In [4]:
from calculator_mod import * 
add(1, 2)

3

On évitera par la suite ce type d'import qui est jugé dangereux.

`import` définit explicitement certains attributs du module

- `__dict__` : dictionnaire utilisé par le module pour l'espace de noms des attributs
- `__name__` : nom du module
- `__file__` : fichier du module
- `__doc__` : documentation du module

In [28]:
print('file', calculator_mod.__file__)
print('name', calculator_mod.__name__)
print('doc', calculator_mod.__doc__)

file /home/loic/Formations/2017/python/cnrs/calculator_mod.py
name calculator_mod
doc 
Calculator module



### Remarque

Lors de l'exécution d'un programme, le module n'est importé qu'une seule fois.  

### Exécution d'un module

On peut ajouter à la fin d'un module le test suivant:

In [None]:
if __name__ == '__main__':
    print(add(1, 2))

On peut à présent exécuter le module.

In [5]:
%%file calculator_mod.py
"""
Calculator module
"""

def add(a, b):
    """
    return a + b
    """
    return a + b

def sub(a, b): 
    """
    return a - b
    """
    return a - b

if __name__ == '__main__':
    print(add(1, 2))

Overwriting calculator_mod.py


In [6]:
! python calculator_mod.py

3


## Un package

### Exemple de package

Comme dit en introduction, un package est un ensemble de modules Python. Prenons l'arborescence suivante

In [16]:
! tree examples/calculator/

[01;34mexamples/calculator/[00m
├── __init__.py
├── [01;34moperator1[00m
│   ├── add.py
│   ├── __init__.py
│   └── sub.py
└── [01;34moperator2[00m
    ├── __init__.py
    └── mult.py

2 directories, 6 files


### Le fichier `__init__.py`

- Il est obligatoire pour que Python considère les répertoires comme contenant des packages ou modules.
- Il peut être vide.
- Il peut contenir du code d'initialisation.
- Il peut contenir des `import`.
- Il peut contenir la variable `__all__`.

### Exemple `calculator/operator1/__init__.py`

In [17]:
__all__ = ["add", "sub"]

De cette manière, on peut importer `add` et `sub` en faisant tout simplement

In [10]:
import sys
sys.path.append("./examples")

In [12]:
from calculator_1.operator1 import *

On accède ensuite aux attributs et aux fonctions en faisant

In [13]:
print(add.add(1, 2))
print(sub.sub(1, 2))

3
-1


### Import relatif

Dans `calculator_1/__init__.py`

In [None]:
from . import operator2
from .operator2 import mult

Dans `calculator_1/operator1/__init__.py`

In [None]:
from .. import operator2
from ..operator2 import mult

### Remarque

Si vous voulez les utiliser en Python 2.7, il faut ajouter

In [4]:
from __future__ import absolute_import

## Recherche de modules et de packages

Pour que Python importe correctement un module, celui-ci doit être dans son **PATH**. Le module `sys` permet de connaître la liste des répertoires où Python va rechercher les modules.

In [16]:
import sys
print(sys.path)

['', '/home/loic/visit/visit2_12_0.linux-x86_64/2.12.0/linux-x86_64/lib', '/home/loic/visit/visit2_12_0.linux-x86_64/2.12.0/linux-x86_64/lib/site-packages', '/home/loic/Logiciels/bempp_compil/lib/python2.7/site-packages', '/home/loic/Logiciels/tau-2.24/x86_64/lib/bindings', '/home/loic/Formations/2017/python/cnrs', '/home/loic/miniconda3/lib/python36.zip', '/home/loic/miniconda3/lib/python3.6', '/home/loic/miniconda3/lib/python3.6/lib-dynload', '/home/loic/miniconda3/lib/python3.6/site-packages', '/home/loic/miniconda3/lib/python3.6/site-packages/fn-0.1.1-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/GitPython-2.1.3-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/docopt-0.6.2-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/gitdb2-2.0.0-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/smmap2-2.0.1-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/fast_sand_paint-0.1.0-py3.6-linux-x86_64.egg', '/home/loic/miniconda

Python va donc rechercher dans

- le répertoire courant
- dans **PYTHONPATH** si défini (c'est la même syntaxe que le **PATH**)
- dans un répertoire par défaut

On peut également rajouter des répertoires à l'exécution étant donné que `sys.path` n'est qu'une liste.

In [17]:
sys.path.append("/home/loic/Formations/")
print(sys.path)

['', '/home/loic/visit/visit2_12_0.linux-x86_64/2.12.0/linux-x86_64/lib', '/home/loic/visit/visit2_12_0.linux-x86_64/2.12.0/linux-x86_64/lib/site-packages', '/home/loic/Logiciels/bempp_compil/lib/python2.7/site-packages', '/home/loic/Logiciels/tau-2.24/x86_64/lib/bindings', '/home/loic/Formations/2017/python/cnrs', '/home/loic/miniconda3/lib/python36.zip', '/home/loic/miniconda3/lib/python3.6', '/home/loic/miniconda3/lib/python3.6/lib-dynload', '/home/loic/miniconda3/lib/python3.6/site-packages', '/home/loic/miniconda3/lib/python3.6/site-packages/fn-0.1.1-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/GitPython-2.1.3-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/docopt-0.6.2-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/gitdb2-2.0.0-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/smmap2-2.0.1-py3.6.egg', '/home/loic/miniconda3/lib/python3.6/site-packages/fast_sand_paint-0.1.0-py3.6-linux-x86_64.egg', '/home/loic/miniconda

Lorsque l'on veut importer **foo**, voici l'ordre des fichiers recherchés dans **sys.path**.

- **foo.dll**, **foo.dylib** ou **foo.so**
- **foo.py**
- **foo.pyc**
- **foo/\_\_init__.py**

## Le packaging

### Le contenu à diffuser

- des modules et des sous packages
- des données
- des scripts
- des dépendances

&nbsp;

<center>
**Attention**
</center>
<center>
A partir du moment où l'on **diffuse**, il est indispensable de mettre une **licence**.
</center>

### Les fichiers nécessaires

Les indispensables

- `setup.py`
- `README.rst` ou `README.md`
- `LICENSE.txt`
- votre `package`

Les optionnels

- `setup.cfg` 
- `MANIFEST.in`

### Arborescence classique

    package/
        doc/
        examples/
        package/
            ...
            tests/
        tests/
        LICENSE.txt
        README.rst
        setup.py

### Les outils

- distutils
- **setuptools**

### Premier exemple de `setup.py`

In [None]:
from setuptools import setup, find_packages

setup(
    name = "calculator",
    packages = find_packages(),
)

- `name` : nom du projet (faire en sorte qu'il ne soit pas trop éloigné du nom du package).
- `find_packages` : regarde dans le répertoire quels sont les modules et les packages présents (`__init__.py`).

    - `include` : définit les répertoires à inspecter.
    - `exclude` : définit les répertoires à exclure.

In [None]:
from setuptools import setup, find_packages

setup(
    name = "calculator",
    packages = find_packages(exclude=['demo', 'doc', 'test*']),
)

### Gestion des dépendences

Il est possible de spécifier les dépendances de son package. 

Par exemple, il est nécessaire d'avoir NumPy pour que celui-ci fonctionne. 

In [None]:
setup(
    ...
    install_requires=['numpy'],
    ...
)

### Gestion des dépendances

On peut également spécifier une version

In [None]:
setup(
    ...
    install_requires=['numpy>=1.0,<1.13'],
    ...
)

### Gestion des dépendances

A partir d'un dépôt git (hg, svn)

In [None]:
setup(
    ...
    install_requires=['numpy==1.13.3'],
    dependency_links=[
        "git+https://github.com/numpy/numpy.git@v1.13.3#egg=numpy-1.13.3"
    ]
    ...
)

Après le `@`, on peut mettre

- un tag
- l'identifiant d'un commit spécifique

### Ajout de données

- Un package peut avoir besoin de fichiers autre que Python.
- On peut vouloir donner de l'information supplémentaire.

### Ajout de données


- `include_package_data` permet d'inclure des fichiers et des dossiers satisfaits par `MANIFEST.in`.
- `package_data` permet de spécifier des fichiers ou dossiers à partir d'expressions (peut s'utiliser en plus de `MANIFEST.in`).
- `exclude_package_data` permet de spécifier des fichiers ou dossiers à ajouter dans la distribution mais pas dans l'installation.

### Ajout de données


<center>
<img src="./images/data/manifest_1.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/manifest_2.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/manifest_3.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/manifest_4.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/package_data_1.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/package_data_2.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/package_data_3.png" style="width: 70%;"/>
</center>

### Ajout de données


<center>
<img src="./images/data/package_data_4.png" style="width: 70%;"/>
</center>

### Ajout de scripts

- `scripts`
- `entry_points`

On préférera utiliser `entry_points` qui fait en sorte d'être compatible cross-platform.

### Ajout de scripts

In [None]:
setup(
    ...
    scripts = ['scripts/calculator'],
    ...
)

### Ajout de scripts

In [None]:
setup(
    ...
    entry_points={ 'console_scripts': [
        'calculator=scripts.command_line:main',
        ],
    },
    ...
)

### Ajouter une extension

Un package ne contient pas forcément uniquement des fichiers Python. On peut par exemple avoir des extensions écrites en `cython`.

In [None]:
from setuptools import setup, find_packages
from setuptools.extension import Extension
from Cython.Build import cythonize

extension = [Extension(name = "calculator.cython_mod", 
                       sources = ["calculator/cython_mod.pyx"])
            ]

setup(
    ...
    ext_modules=cythonize(extension),
    ...
)

### Définir une version

Afin de créer par la suite une distribution, il est nécessaire de définir une version du package.

On peut utiliser les [règles de sémantique de version](http://semver.org/) MAJOR.MINOR.PATCH

- `MAJOR` version utilisée lorsque l'on fait des changements qui sont incompatibles avec l'API précédente.
- `MINOR` version utilisée lorsque l'on ajoute de nouvelles fonctionnalités.
- `PATCH` version utilisée lorsque l'on corrige des bugs

Il est également possible de rajouter des labels à la fin pour dire si ce sont des pré-releases, des versions beta, ...

### Définir une version

In [None]:
MAJOR = 0
MINOR = 1
PATCH = 1
VERSION = "{}.{}.{}".format(MAJOR, MINOR, MAINTENANCE)

with open("calculator/version.py", "w") as f:
    f.write("__version__ = '{}'\n".format(VERSION))
    
setup(
    ...
    version = VERSION,
    ...
)

### Ajouter une licence

Lorsque l'on veut distribuer son package, il est indispensable de mettre une licence. Sinon, une personne tierce n'est pas autorisée à l'utiliser.

Les licences les plus connues

- GPL
- LGPL
- CECILL
- BSD
- MIT

Pour plus d'informations, voir la journée LOoPS ["Je code, je diffuse, oui mais comment ?"](https://reseau-loops.github.io/journee_2015_11.html).

### Ajouter une licence

- Ajouter un fichier `LICENSE.txt`
- Ajouter un en-tête dans chaque fichier indiquant les auteurs et rappelant la licence.

In [None]:
# Authors:
#     Loic Gouarin <loic.gouarin@math.u-psud.fr>
#
# License: BSD 3 clause

### Autres informations

In [None]:
setup(
    name = "calculator",
    author = "Loic Gouarin",
    author_email = "loic.gouarin@math.u-psud.fr",
    url = "http://github.com/gouarin/calculator",
    description = "simple calculator",
    license = "BSD",
    keywords = "calculator",
    ...
)

## Rendre le package disponible sur Pypi et conda

### sdist et bdist

Lorsque l'on veut créer une distribution disponible sur Pypi, nous avons deux options.

- `sdist` crée une archive de notre package. Lorsqu'un utilisateur utilise `pip` pour l'installer, le processus suivant est effectué

In [None]:
python setup.py install 

- `bdist` crée un binaire et est donc spécifique à une plateforme si des modules sont compilés. Ceci permet d'avoir une installation beaucoup plus rapide du fait qu'il n'y a pas de processus de compilation.

### sdist

In [None]:
python setup.py sdist

crée une archive dans le répertoire `dist`.

### bdist: universal wheels

Si le package contient que des fichiers Python et qu'il est compatible Python 2 et 3.

In [None]:
python setup.py bdist_wheel --universal

ou mettre dans le fichier `setup.cfg`

In [None]:
[bdist_wheel]
universal=1

On a alors dans le répertoire `dist` le fichier `calculator-0.1.1-py2.py3-none-any.whl`.

### bdist: pure Python wheels

Lorsque le package ne contient que des fichiers Python, mais qu'il ne fonctionne que pour la version 2 ou 3.

In [None]:
python setup.py bdist_wheel

On a alors dans le répertoire `dist` le fichier `calculator-0.1.1-py3-none-any.whl` si on l'a construit avec un Python 3.

### bdist: platform wheels

Lorsque le package contient des fichiers compilés.

In [None]:
python setup.py bdist_wheel

On a alors dans le répertoire `dist` le fichier `calculator-0.1.1-cp36-cp36m-linux_x86_64.whl` si on l'a construit avec un Python 3 dans un environnement linux.

### Classifiers

Les classifiers sont utilisés pour spécifier par une liste déjà établie les spécificités du package. Vous avez une liste complète [ici](https://pypi.python.org/pypi?%3Aaction=list_classifiers).

In [None]:
CLASSIFIERS = [
    "Development Status :: 3 - Alpha",
    "Intended Audience :: Science/Research",
    "License :: OSI Approved :: BSD License",
    "Programming Language :: Cython",
    "Programming Language :: Python :: 2",
    "Programming Language :: Python :: 2.7",
    "Programming Language :: Python :: 3",
    "Programming Language :: Python :: 3.3",
    "Programming Language :: Python :: 3.4",
    "Programming Language :: Python :: 3.5",
    "Topic :: Software Development",
    "Topic :: Scientific/Engineering",
    "Operating System :: Microsoft :: Windows",
    "Operating System :: POSIX",
    "Operating System :: Unix",
    "Operating System :: MacOS"
]

setup(
    ...
    classifiers = CLASSIFIERS,
    ...
)

### twine

`twine` permet de mettre les distributions créées se trouvant dans le répertoire `dist` sur PyPi. Il existe deux sites

- https://pypi.org/ (le site officiel)
- https://test.pypi.org/ (le site pour faire des tests)

Avant d'utiliser `twine`, il est nécessaire de se créer un compte 

- https://pypi.org/account/register/
- https://test.pypi.org/account/register/

### twine

Pour mettre l'ensemble des distributions 

- `pypi.org`

In [None]:
twine upload dist/*

- `test.pypi.org`

In [None]:
twine upload --repository-url https://test.pypi.org/legacy/ dist/*

### Recherche du package

- `pypi.org`

In [None]:
pip search calculator

- `test.pypi.org`

In [None]:
pip search --index https://testpypi.python.org/pypi calculator

### Configuration de PyPi

Pour éviter de taper son mot de passe à chaque fois, il es possible d'écrire un fichier `~/.pypirc` avec les informations suivantes

In [None]:
[pypi]
username = <username>
password = <password>

### conda

Il est également possible de mettre son package sur conda. Comme pour PyPi, il est necessaire de se créer un compte pour pouvoir avoir sa propre `channel` (https://anaconda.org/).

Il est ensuite nécessaire d'installer différents outils pour pouvoir uploader vos fichiers.

In [None]:
conda install conda-build anaconda-client

Il est possible d'installer des packages qui ne sont pas forcément écrits en Python. 

[`conda-forge`](https://conda-forge.org/) est un endroit où l'on peut trouver ces packages. 

Le but est d'écrire des recettes permettant de compiler le projet sur différentes plateformes (linux, mac OSX, windows).

Le processus de soumission peut être assez long, c'est pourquoi nous utiliserons notre propre channel dans la suite.

Pour utiliser une autre channel que celle par défaut

In [None]:
conda search -c conda-forge jupyterlab 

### Création du squelette pour conda

In [None]:
conda skeleton pypi recipes

Cette commande crée un répertoire `recipes` dans lequel se trouve un fichier `meta.yaml` qu'il faut modifier.

Il peut être également nécessaire d'écrire deux autres fichiers

- `build.sh` : https://conda.io/docs/_downloads/build1.sh
- `build.bat` : https://conda.io/docs/_downloads/bld.bat

### Exemple de fichier `meta.yaml`

In [None]:
{% set name = "calculator" %}
{% set version = "0.1.1" %}

package:
  name: '{{ name|lower }}'
  version: '{{ version }}'

source:
  path: ../

build:
  number: 0
  script: python setup.py install

requirements:
  build:
    - python
    - setuptools
  run:
    - python

test:
  imports:
    - calculator

about:
  home: http://github.com/gouarin/calculator
  license: MIT
  description: Simple calculator project

extra:
  recipe-maintainers: Loic Gouarin <loic.gouarin@gmail.com>

### Construction de la recette

Une fois les fichiers du répertoire recipes modifiés, il faut exécuter la commande suivante

In [None]:
conda build recipes

### Tester en local

In [None]:
conda install --use-local calculator

### Uploader les fichiers sur sa channel

In [None]:
conda install anaconda-client
anaconda upload /home/loic/miniconda3/conda-bld/linux-64/calculator-0.1.1-py36h585410b_0.tar.bz2

### Références

- [Python Packaging User Guide](https://packaging.python.org/)
- [Les aventuriers du packaging perdu](https://youtu.be/Y5xMQYw9lls)