---

# Langages de script - Python
## Cours 9 — Pip et virtualenv
### M2 Ingénierie Multilingue - INaLCO

---

- Loïc Grobol <loic.grobol@gmail.com>
- Yoann Dupont <yoa.dupont@gmail.com>

# Les modules sont vos amis

Rappel des épisodes précédents

## Ils cachent vos implémentations

- Quand on code une interface, on a pas envie de voir le code fonctionnel
- Et vice-versa

Ce qu'on fait quand on code proprement (ou presque)

```python
# malib.py
import re

def tokenize(s):
    return re.split(r"\s+", s)
```

```python
# moninterface.py
import sys
import malib

if __name__ == "__main__":
    path = sys.argv[1]
    with open(path) as in_stream:
        for l in in_stream:
            print("_".join(list(malib.tokenize(l))))
```

Comme ça quand je code mon interface, je n'ai pas besoin de me souvenir ou même de voir comment est codé `tokenize`

## Il y en a déjà plein

In [None]:
help("modules")

## Ils vous simplifient la vie

In [None]:
import pathlib

p = pathlib.Path(".").resolve()
display(p)
display(list(p.glob("*.ipynb")))
projet = p.parent / "assignments"
display(list(exos.glob("*")))

# `stdlib` ne suffit plus

Parfois la bibliothèque standard est trop limitée

Je veux repérer dans un texte toutes les occurences de « omelette » qui ne sont pas précédées par « une »

In [None]:
text = """oui très bien maintenant il reste plus que quelques petites questions pour sit-
oui c' était les c' était la dernière chose que je voulais vous demander les Anglais prétendent que même dans les moindres choses y a des différences entre euh la façon de vivre des Français et des Anglais et euh c' est pourquoi euh ils demandent euh ils se demandaient comment en France par exemple on faisait une omelette et s' il y avait des différences entre euh la façon française de faire une omelette et la façon anglaise alors si vous pouviez décrire comment vous vous faites une  omelette ?
tout d' abord on m- on casse les oeufs dans un saladier euh on mélange le le blanc et le jaune et puis on on bat avec soit avec une fourchette soit avec un appareil parce qu' il existe des appareils pour battre les oeufs euh vous prenez une poêle vous y mettez du beurre et quand il est fondu euh vous versez l' omelette par dessus euh t- j' ai oublié de dire qu' on mettait du sel et du poivre dans dans les oeufs
hm hm ?
et quand euh vous avez versé le les oeufs dans la dans la poêle euh vous euh vous quand ça prend consistance vous retournez votre omelette en faisant attention de euh de la retourner comme il faut évidemment qu' elle ne se mette pas en miettes et vous la faites cuire de l' autre côté et pour la présenter on la plie en deux maintenant on peut mettre aussi dans le dans le dans les oeufs euh des fines herbes"""

In [None]:
import re
pattern = r"(?<!une )omelette"
re.findall(pattern, text)

Mais je veux pouvoir le faire même s'il y a plusieurs espaces

In [None]:
pattern = r"(?<!une\s+)omelette"
re.findall(pattern, text)

`re` ne permet pas de faire ce genre de choses (un *lookbehind* de taille variable) mais [`regex`](https://pypi.org/project/regex) oui

In [None]:
import regex
pattern = r"(?<!une\s+)omelette"
regex.findall(pattern, text)

## `pip`, le gestionnaire

[`pip`](https://pip.pypa.io) est le gestionnaire de paquets intégré à python (sauf sous Debian 😠).
Comme tout bon gestionnaire de paquet il sait

- Installer un paquet `pip install regex`
- Donner des infos `pip show regex`
- Le mettre à jour `pip install -U regex`
- Le désinstaller `pip uninstall regex`

## Pypi, le *cheeseshop*

Situé à https://pypi.org, Pypi liste les paquets tiers — conçus et maintenus par la communauté — pour Python.

Quand vous demandez à `pip` d'installer un paquet, c'est là qu'il va le chercher par défaut.

In [None]:
!pip search regex

Vous pouvez aussi le parcourir dans l'inteface web, c'est un bon point de départ pour éviter de réinventer la roue.

Le moteur de pypi est libre et rien ne vous empêche d'héberger votre propre instance, il suffira alors d'utiliser pip avec l'option `--index-url <url>`

`pip` sait faire plein d'autres choses et installer depuis beaucoup de sources. Par exemple un dépôt git

In [None]:
!pip install --force-reinstall git+https://github.com/psf/requests.git

# Les choses désagréables

Il y a des choses pour lesquelles `pip` n'est pas bon

## Résoudre des conflits de dépendances

In [None]:
!pip install -U --force-reinstall botocore==1.13.9 python-dateutil>=2.1

[Mais plus pour longtemps !](https://github.com/pypa/pip/issues/988)

##Checker ses privilèges

```bash
$ pip install regex
ERROR: Could not install packages due to an EnvironmentError: [Errno 13] Permission denied: '/usr/local/lib/python2.7/dist-packages/
```

Un remède simple : n'installer que pour soi

```bash
$ pip install --user regex
Successfully installed regex-2019.11.1
```

## Répondre quand on l'appelle

Ou plutôt c'est python qui a un souci

```bash
$ pip install --user regex
Successfully installed regex-2019.11.1
$ python3 -c "import regex;print(regex.__version__)"
ModuleNotFoundError: No module named 'regex
```

```bash
$ pip --version
pip 19.3.1 from /home/lgrobol/.local/lib/python3.8/site-packages/pip (python 3.8)
$ python3 --version
Python 3.7.5rc1
```

La solution : exiger le bon python

```bash
$ python3 -m pip install --user regex
Successfully installed regex-2019.11.1
$ python3 -c "import regex;print(regex.__version__)"
2.5.65
```

# Freeze!

Une fonction importante de `pip` est la capacité de geler les versions des paquets installés et de les restorer

In [None]:
!pip freeze

(Traditionellement, pour les sauvegarder: `pip freeze > requirements.txt`)

Il est **fortement** recommandé de le faire quand on lance une expérience pour pouvoir la reproduire dans les mêmes conditions si besoin.

Pour restorer les mêmes versions

```bash
pip install -r requirements.txt
```

(éventuellement avec `-U` et `--force-reinstall` en plus et bien sûr `--user`)

On peut aussi écrire des `requirements.txt` à la main pour préciser les dépendances d'un projet

In [None]:
!cat ../requirements.txt

# `virtualenv`

À force d'installer tout et n'importe quoi, il finit fatalement par arriver que

- Des paquets que vous utilisez dans des projets séparés aient des conflits de version
- Vous passiez votre temps à installer depuis des `requirements.txt`
- Vos `requirements.txt` soient soit incomplets soit trop complets

Et arrive la conclusion

**En fait il me faudrait une installation différente de python pour chaque projet !**

Et c'est précisément ce qu'on va faire

In [None]:
!pip install virtualenv

## Comment ?

- Placez-vous dans un répertoire vide

```bash
mkdir -p ~/tmp/python-im-test/cours-9 && cd ~/tmp/python-im-test/cours-9
```

- Entrez

```bash
python3 -m virtualenv .virtenv
```

- Vous avez créé un environnement virtuel \o/ activez-le

```bash
source .virtenv/bin/activate
```

## Et alors ?

```bash
$ pip list
Package    Version
---------- -------
pip        19.3.1 
setuptools 41.6.0 
wheel      0.33.6
```

Alors vous avez ici une installation isolée du reste !

```bash
wget https://raw.githubusercontent.com/LoicGrobol/python-im-2/master/requirements.txt
pip install -r requirements.txt
```

Et maintenant vous avez tous les paquets utilisés dans ce cours. En bonus

- `pip` est le bon `pip`
- `python` est le bon `python`
- Tout ce que vous faites avec python n'agira que sur `.virtenv`, votre système reste propre !

En particulier, si rien ne va plus, il suffit de supprimer `.virtenv`

## `virtualenv` vs `venv`

Il existe dans la distribution standard (sauf pour Debian 🙃) le module `venv` et un module tiers `virtualenv`.

`venv` est essentiellement une version minimale de `virtualenv` avec uniquement les fonctionalités strictement nécéssaires. En pratique on a rarement besoin de plus **sauf** quand on veut installer plusieurs versions de python en parallèle.

# Comment travailler proprement

À partir de maintenant vous pouvez (et je vous recommande de)

- **Toujours** travailler dans un virtualenv
- **Toujours** lister vos dépendances tierces dans un requirements.txt
- **Toujours** `pip freeze`er les versions exactes pour vos expés (dans un `frozen-requirements.txt` par exemple.
- **Dès qu'un test se transforme en projet** en faire un dépôt git

Si vous travaillez avec `git` et `virtualenv` dans le même dossier pensez à ajouter le nom du dossier de votre environnement dans un `.gitignore`

```gitignore
# .gitignore
.virtenv
__pycache__/
…
```

(Les gens de github ont des .gitingore tout faits, [celui pour Python](https://github.com/github/gitignore/blob/master/Python.gitignore) utilise `.venv` mais c'est moyen d'utiliser le nom d'un module pour un dossier)

**Maintenant allez-y, faites ça dans vos dossiers de projets !**