<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

In [None]:
from plan import plan; plan("compléments", "librairies")

# librairies utiles

## librairie standard

* le tutorial Python sur ce sujet occupe deux chapitres
  * [chapitre 10](https://docs.python.org/3/tutorial/stdlib.html) et
  * [chapitre 11](https://docs.python.org/3/tutorial/stdlib2.html)
  
* très très complet, je fais ici un tri arbitraire  


### `logging`

* dans du code de production on ne fait jamais `print()`
* on utilise à la place `logging`; de cette façon
* le code a seulement à choisir un **niveau** de message
  * parmi error, warning, info, debug
* on pourra plus tard (i.e. par l'équipe Ops) 
  * choisir **où** doivent aller les messages
  * avec quel niveau de gravité
  * et même selon les modules si nécessaire

#### `logging`

In [None]:
import logging
logging.basicConfig(level=logging.INFO)

In [None]:
# au lieu de faire 
print(f"Bonjour le monde") 

In [None]:
# on fera plutôt
logging.info("Bonjour le monde")

### `sys` et `os`

#### `import sys`

* gestions de variables utilisées par l’interpréteur

#### `import os`

* accès cross-platform au système d’exploitation

### `from pathlib import Path`  ( ~~`import os.path`~~)

* historiquement on gérait les noms de fichiers sur disque avec le sous-module `os.path`
* depuis la 3.4 une alternative **orientée objet** est disponible
* il faut l'utiliser pour du nouveau code 
* on peut tout faire avec
  * chercher (`glob`) tous les fichiers en `*.truc`
  * calculer les noms de fichier: concaténer, découper en morceaux, trouver le nom canonique
  * ouvrir les fichier
  * accéder aux métadata (taille, date, ..)
  * etc...

In [None]:
from pathlib import Path

for path in Path(".").glob("samples/*.py"):
    # le nom canonique
    print(10*'=', path.absolute())
    # le dernier morceau dans le nom
    print(path.name, end=' ')
    # la taille
    print(path.stat().st_size, 'bytes')
    # touver le nom absolu
    # ouvrir le fichier en lecture
    with path.open():
        pass

### `pathlib`

In [None]:
# à signaler, les calculs de chemin 
# se font directement à base de l'opérateur /  
répertoire = Path(".")
fichier = répertoire / "samples" / "types01.py"

with fichier.open() as feed:
    for lineno, line in enumerate(feed, 1):
        print(f"{lineno}:{line}", end="")
    
    

### `datetime`, `math` et `random`

#### `datetime`

* gestion des dates et des heures

#### `math`

* fonctions mathématiques, constantes, ...

#### `random`

* générations de nombres et séquences aléatoires, mélange aléatoire de séquences

### formats de fichier

#### `json`

* sérialisation d’objets python, standard du web
* envoi et réception depuis toutes sources compatibles json

#### `csv`

* ouverture fichier csv, compatible Excel et tableurs

#### `pickle`

* sérialisation d’objets python, uniquement compatible avec python
* sauvegarde et la chargement du disque dur

### `collections`

* une extension des objets *built-in* `list`, `tuple`, `dict`
* [la doc](https://docs.python.org/3.5/library/collections.html)


####  `collections.Counter()`

* à partir d'un itérable, construit un dictionnaire qui contient 
* comme clefs les éléments uniques 
* et comme valeurs le nombre de fois que l’élément apparaît
* http://sametmax.com/compter-et-grouper-encore-plus-faineant/

In [None]:
from collections import Counter

cnt = Counter(['red', 'blue', 'red', 'green', 'blue', 'blue'])
cnt

In [None]:
isinstance(cnt, dict)

In [None]:
import re
words = re.findall(r'\w+', open('../data/hamlet.txt').read().lower())
Counter(words).most_common(10)

#### `collections.defaultdict()`

* étend les dictionnaires pour en faciliter l’initialisation
* un bon remplacement pour `dict.setdefault` qui est moins parlant
* https://docs.python.org/3/library/collections.html?#collections.defaultdict

In [None]:
from collections import defaultdict

s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
# on indique que les valeurs sont des listes
d = defaultdict(list)
# si on écrit une clé qui n'est pas encore présente
# d[k] vaut alors list()
# c'est-à-dire une liste vide est crée automatiquement
for k, v in s:
    d[k].append(v)

sorted(d.items())
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

### `itertools` - combinatoire

* implémente sous forme efficace (itérateurs)
* des combinatoires classiques
* et autres outils utiles pour écrire des boucles concises
* [la doc](https://docs.python.org/3/library/itertools.html)
* déjà abordé dans la partie 3.3 sur les itérateurs

fournit les combinatoires communes

* [`produit cartésien`](https://docs.python.org/3.6/library/itertools.html#itertools.product)
* [`permutations`](https://docs.python.org/3.6/library/itertools.html#itertools.permutations)
* [`combinaisons`](https://docs.python.org/3.6/library/itertools.html#itertools.combinations) *n* parmi *p* 

#### `itertools` - produit cartésien

In [None]:
from itertools import product
A = ['a', 'b', 'c']
B = [ 1, 2]

for x, y in product(A, B):
    print(x, y)

#### `itertools` - permutations

In [None]:
from itertools import permutations
C = ['a', 'b', 'c', 'd']

for tuple in permutations(C):
    print(tuple)

#### `itertools` - combinaisons

In [None]:
from itertools import combinations
miniloto = list(range(5))

for a, b in combinations(miniloto, 2):
    print(a, b)

In [None]:
# je n'ai pas trouvé pour les arrangements
# une possibilité est de générer toutes les permutations
# de chaque tirage dans les combinaisons
for tuple in combinations(miniloto, 2):
    for a, b in permutations(tuple):
        print(a, b)

### module `itertools` - divers

* parfois sans fin
  * `count(10) --> 10 11 12 13 14 ...`
  * `cycle('abcd') --> a b c d a b c d ...`
* ou pas
  * `repeat(10, 3) --> 10 10 10`
  * `islice('abcdefg', 2, none) --> c d e f g`

#### module `itertools` - suite

* chainer plusieurs itérations
  * `chain('ABC', 'DEF') --> A B C D E F`
  * `chain.from_iterable(['ABC', 'DEF']) --> A B C D E F`

* avec un peu de logique
  * `takewhile(lambda x: x<5, [1,4,6,4,1]) --> 1 4`
  * `dropwhile(lambda x: x<5, [1,4,6,4,1]) --> 6 4 1`
  * `compress('ABCDEF', [1,0,1,0,1,1]) --> A C E F`
  * `filterfalse(lambda x: x%2, range(10)) --> 0 2 4 6 8`

In [None]:
from itertools import filterfalse

In [None]:
%timeit -n 100 for x in filterfalse(lambda x:x%2, range(10000)): pass

In [None]:
%timeit -n 100 for x in (y for y in range(10000) if not (y % 2)): pass

### librairies très utiles

### `operator`

* en python tout est un objet, on peut donc tout passer à une fonction, mais comment passer un opérateur comme `+`, `in`, ou `>` 
* le module `operator` contient la version fonctionnelle d’un grand nombre d’opérateurs python
* http://sametmax.com/le-module-operator-en-python/

In [None]:
import random
l = [('a', random.randint(1, 1000)) for i in range(100)]
l.sort(key=lambda x: x[1])
l[-7:]

In [None]:
l = [('a', random.randint(1, 1000)) for i in range(100)]
import operator
l.sort(key=operator.itemgetter(1))
l[-7:]

## librairies tierces (non standard)

### `pypi.org`

* toutes les librairies importantes se trouvent ici
  * https://pypi.python.org/
* **attention** n'importe qui peut publier
  * présence sur pypi ⇎ code fiable, supporté

* `pip` est le programme qui permet de les installer facilement
  * fourni avec Python à partir de 3.4 (et de 2.7.9 pour 2.x)
  * sinon suivre la documentation officielle de pip
  * https://pip.pypa.io/en/latest/installing.html

### `pip` : comment installer une librairie externe

```
$ pip help

Usage:
  pip <command> [options]

Commands:
  install                     Install packages.
  download                    Download packages.
  uninstall                   Uninstall packages.
  freeze                      Output installed packages in requirements format.
  list                        List installed packages.
  show                        Show information about installed packages.
  search                      Search PyPI for packages
…
```

In [None]:
# par exemple (enlever le ! si dans le terminal)

!pip install numpy

* capable de gérer les setups complexes  
  y compris lorsque du code binaire est nécessaire
  (cf *wheels*) 
* n'affranchit pas de bien lire la doc d'installation  
  lorsqu'une approche naïve écohue
* à signaler aussi :
  utilisez `python -m pip` à la place de `pip`  
  en cas de multiples installations + ou - stables  
  être sûr d'installer pour le bon Python

## environnements virtuels

* les pros ont besoin de mélanger plein de configurations
* pour passer d'un projet à un autre
* chacun avec ses modules et versions (ex. Django-2.x ou Django-3.x)
* qui doivent pouvoir coexister dans le même ordi
* une unique installation Python sur votre machine ne suffit plus

les environnements virtuels répondent à ce besoin
* facile à créer (et vide)
* facile à détruire
* facile à passer de l'un à l'autre
* tout se fait sous un user 'lamda'  
  pas besoin de droits administrateurs

### `venv` / `virtualenv`

* `virtualenv` : historiquement le premier  
* `venv` : inspiré de, intégré dans la librairie standard

pas mal de surcouches au dessus, mais d'une utilité 
de plus en plus discutable amha

### miniconda

une alternative intéressante, car elle permet **aussi** de changer de Python

ex:

* `enva` avec Python-3.6 et Django-2.x
* `enbv` avec Python-3.8 et Django-3.x

dans les deux cas (`virtualenv` et `miniconda`)  
bien soigner l'environnement du terminal  
pour bien **toujours afficher** dans quel environnement on se trouve  
(dans le prompt du shell typiquement)  
sinon on a facilement des surprises

### mon approche personnelle

* typiquement un environnement virtuel par projet
* basé sur une convention de nommage simple
  * projet `X` 
  * = repository git `~/git/X`
  * = environnement virtuel `X`
* changer de répertoire implique changer d'environnement virtuel

#### *hands-on*

* on crée un *virtualenv* **vide** avec `virtualenv le/chemin/venv`
* on y entre dans un avec `source le/chemin/venv/bin/activate`
* on y sort avec juste `deactivate`

```bash
tparment /tmp $ virtualenv venv
Using base prefix '/usr/local/Cellar/python/3.7.0/Frameworks/Python.framework/Versions/3.7'
New python executable in /private/tmp/venv/bin/python3.7
Also creating executable in /private/tmp/venv/bin/python
Installing setuptools, pip, wheel...
done.

tparment /tmp $ ls venv/bin/activate
venv/bin/activate
tparment /tmp $ source venv/bin/activate

[venv @ tmp] tparment /tmp $ pip3 freeze
[venv @ tmp] tparment /tmp $ python3 -c 'import numpy'
Traceback (most recent call last):
  File "<string>", line 1, in <module>
ModuleNotFoundError: No module named 'numpy'

[venv @ tmp] tparment /tmp $ deactivate
tparment /tmp $
```