<style>div.title-slide {    width: 100%;    display: flex;    flex-direction: row;            /* default value; can be omitted */    flex-wrap: nowrap;              /* default value; can be omitted */    justify-content: space-between;}</style><div class="title-slide">
<span style="float:left;">Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
<span><img src="media/both-logos-small-alpha.png" style="display:inline" /></span>
</div>

# Outils périphériques

## Compléments - niveau intermédiaire

Pour conclure le tronc commun de ce cours Python, nous allons très rapidement citer quelques outils qui ne sont pas nécessairement dans la bibliothèque standard, mais qui sont très largement utilisés dans l'écosystème python.

Il s'agit d'une liste non exhaustive bien entendu.

### Distribution et packaging

On l'a rapidement mentionné, il existe une infrastructure globale pour la distribution de librairies écrites en python. Celle-ci repose sur

* un site web <https://pypi.org/> où l'on peut consulter les - très nombreuses - bibliothèques diffusées, avec leurs historiques et révisions,
* un outil en ligne de commande `pip`, pour installer et mettre à jour ces bibliothèques (utiliser `pip3` comme `python3` si vous avez python2 installé en parallèle),
* et enfin un système de packaging à destination des éditeurs.

Je vous signale, par rapport à ce dernier point, que la bibliothèque standard vient avec un outil qui s'appelle `distutils`, qui est essentiellement obsolète, et qui n'est conservé que pour des questions de compatibilité. Si vous devez commencer depuis une feuille blanche le packaging d'une nouvelle librairie, je vous recommande d'utiliser plutôt `setuptools` qui est le standard de fait dans le domaine. 

Dans une domaine très voisin, l'outil `virtualenv` est très populaire également ; il permet de créer sur une seul machine, plusieurs environnements python avec des versions et contenus différents.

C'est très utile si vous travaillez sur plusieurs projets, dont l'un a besoin de python-3.5 avec numpy et sans pandas, et Django-1.11, et un second avec python-3.6 sans numpy et avec Django-2.0.

Pour finir, on ne peut pas parler de packaging sans citer `conda`, l'outil de référence pour la packaging et les environnements virtuels en data science. Quelques références sur conda :

 * une documentation complète de conda <https://conda.io/docs/>
 * une excellente discussion (en anglais) sur le positionnement de `pip` et `conda` <http://jakevdp.github.io/blog/2016/08/25/conda-myths-and-misconceptions/>

### Debugging

Pour le debugging, la bibliothèque standard s'appelle `pdb`. Typiquement pour mettre un *breakpoint* on écrit :

```python
def foo(n):
    n = n ** 2
    # pour mettre un point d'arrêt
    import pdb
    pdb.set_trace()
    # la suite de foo()
    return n / 10
```

Je vous signale d'ailleurs qu'à partir de Python 3.7, il est recommandé d'utiliser la nouvelle fonction *built-in* _breakpoint()_ qui rend le même service.

### Tests

Le module `unittest` de la bibliothèque standard fournit des fonctionnalités de base pour écrire des tests unitaires.

Je vous signale par ailleurs des outils comme `nosetests` et `pytest`, qui ne sont pas dans la distribution standard, mais qui enrichissent les capacités de `unittest` pour en rendre l'utilisation quotidienne plus fluide.

### Documentation

Le standard de fait dans ce domaine est clairement une combinaison basée sur

* l'outil `sphinx`, qui permet de générer la documentation à partir du source, avec
  * des plugins pour divers sous-formats dans les docstrings,
  * un système de templating,
  * et de nombreuses autres possibilités ;
* `readthedocs.io` qui est une plateforme ouverte pour l'hébergement des documentations ; elle-même facilement intégrable avec un repository type `github.io`, 

Pour vous donner une idée du résultat, je vous invite à consulter un module de ma facture :

* les sources sur github sur <https://github.com/parmentelat/asynciojobs>, et notamment le sous-répertoire `sphinx`,
* et la documentation en ligne sur <http://asynciojobs.readthedocs.io/>.

### Linter

Au delà de la vérification automatique de la présentation du code (PEP8), il existe un outil `pylint` qui fait de l'analyse de code source en vue de détecter des erreurs le plus tôt possible dans le cycle de développement.

En quelques mots, ma recommandation à ce sujet est que :

* tout d'abord, et comme dans tous les langages en fait, il est **très utile** de faire passer systématiquement son code dans un linter de ce genre ;
* idéalement on ne devrait commiter que du code qui passe cette étape ;
* cependant, il y a un petit travail de filtrage à faire au démarrage, car pylint détecte plusieurs centaines de sortes d'erreurs, du coup il convient de passer un moment à configurer l'outil pour qu'il en ignore certaines.

Dès que vous commencez à travailler sur des projets sérieux, vous devez utiliser un éditeur qui intègre et exécute automatiquement `pylint`. On peut notamment recommander [PyCharm](https://www.jetbrains.com/pycharm/). 

### Type hints

Je voudrais citer enfin l'outil `mypy` qui est un complément crucial dans la mise en oeuvre des *type hints*. 

Comme on l'a vu en Semaine 4 dans la séquence consacrée aux type hints, et en tous cas jusque Python-3.6, les annotations de typage que vous insérez éventuellement dans votre code sont complètement ignorées de l'interpréteur. 

Elles sont par contre analysées par l'outil `mypy` qui fournit une sorte de couche supplémentaire de *linter* et permet de détecter, ici encore, les éventuelles erreurs qui peuvent résulter notamment d'une mauvaise utilisation de telle ou telle librairie.

### Conclusion

À nouveau cette liste n'est pas exhaustive, elle s'efforce simplement de guider vos premiers pas dans cet écosystème.

Je vous invite à creuser de votre coté les différents aspects qui, parmi cette liste, vous semblent les plus intéressants pour votre usage. 