# Les bonnes pratiques du développeur Python

![image](./images/best_practice.gif)

# Concevoir un logiciel avec Python

![image](./images/dev-gilbert.gif)

# Concevoir un outil

1. Déterminer les besoins et fixer les objectifs : 
    - que doit faire le logiciel, dans quel cadre va-t-il servir, quels seront les utilisateurs types ? 
    - On rédige un cahier des charges avec le commanditaire du logiciel (Remarque : commanditaire = maître d’ouvrage ; réalisateur = maître d’oeuvre)
2. Conception et spécifications : 
    - quels sont les fonctionnalités du logiciel, avec quelle interface ?
3. Développement : modélisation et codage
4. Tests : 
    - obtient-on les résultats attendus, les calculs sont corrects ?
5. Déploiement : 
    - installer le chez le client (vérification des configurations, installation de l’exécutable et des fichiers annexes, etc.)
6. Maintenance : 
    - corrective, traquer les bugs et les corriger ; évolutive


# Développement

- Un certain nombre de questions se posent :
    - Quel langage ?
        - Dépend des méthodes mobilisées
        - Dépend du format des données utilisées
        - Dépend des objectifs attendus
    - Un langage ou plusieurs langages ?
        - Dépend des nécessités d’optimisations : Python est un bon langage mais peu rapide sur des grosses quantités de données
        - A-t-on besoin de fonctionnalités très spécialisées : R
        - A-t-on besoin de rapidité : C++
        - Est-on dans le cadre de données « big data » non structurées : map reduce, scala…

    

# Tests et maintenance

Les points importants :
- Versionnement
- Tests unitaires
- Intégration continue

...

# Projets

- Un projet de développement doit être inscrit dans un projet python
- Un projet, c'est :
    - un ensemble de scripts
    - un répertoire commun
    - un environnement spécifique
    - un nom

En voici un exemple :
```
README.rst
LICENSE
setup.py
requirements.txt
votre_code/__init__.py
votre_code/core.py
votre_code/helpers.py
docs/conf.py
docs/index.rst
tests/test_basic.py
tests/test_advanced.py
```

# La gestion des environnements

Anaconda prompt vous permet de créer des environnements dans lesquels les packages que vous utilisez seront stockés.

Au début de la ligne de commande, vous verrez l'environnement courant :
```
(base) c:\...
```
Pour afficher tous les environnements disponibles, on utilise :
```
conda env list
```
Sous Windows, on active un environnement avec :
```
activate mon_env
```
Si vous voulez créer un environnement, on utilise :
```
conda create --name mon_env
```


# La gestion des environnements (suite)

### La sauvegarde d'environnements

Pour sauvegarder un environnement dans un fichier .yml, on utilise :
```
conda env export > environment.yml
```
Pour charger un environnement à partir d'un fichier .yml, on utilise :
```
conda env create -f environment.yml
```

### Ajouter des packages dans votre environnements
Depuis conda : `conda install scipy`

Depuis PyPi : `pip install scipy`

On privilégie l'approche *conda* à l'approche *pip* lorsque cela est possible

Plus d'infos : <https://conda.io/docs/user-guide/tasks/manage-environments.html>

# Les packages et les modules en Python

- Il s’agit d’un ensemble de fonctions qui pourront être appelées d’un autre programme

- On utilise :
```
import nom_pkg
```
- Si on utilise `as nm` par exemple, ceci permet de raccourcir l'appel aux fonctions du package
- On peut utiliser `from mon_pkg import *`, dans ce cas plus de préfixes mais attention aux conflits
- On peut aussi utiliser des fonctions ou des classes spécifiques (plus besoin de préfixe)
```
from pandas import Series
```

*Si on cherche des informations sur un module, on peut utiliser `dir()` et `help()`*

In [89]:
import numpy as np

# Créer votre module et votre package

- Il est très simple de faire appel à des fonctions ou à des classes depuis un autre fichier
- Il suffit de stocker vos classes et fonctions dans un fichier `.py`
- Celui-ci pourra être stocké dans un répertoire appartenant aux chemins de Python ou dans votre répertoire de travail
- Vous avez alors la possibilité de faire :
```
import mon_fichier
```
et d’utiliser les fonctions et classes de ce fichiers

- Vous venez de créer un module. 
- **Attention ceci n’est pas un package !**

# Créer votre module et votre package (suite)


- Un package est constitué de plus d’informations qu’un simple fichier `.py`


- Voici les étapes pour créer votre premier package :
    - Choisissez un nom simple et traduisant bien ce que va faire votre package (si possible un nom qui n’est pas déjà utilisé)
    - Créez un répertoire du nom de votre package
    - Créez un fichier `__init__.py` dans ce répertoire, ce fichier peut être vide dans un premier temps
    - Dans le même répertoire ajoutez des fichiers avec vos fonctions et vos classes

Si votre objectif est de publier le package sur PyPi, il faudra ajouter un fichier setup et les dépendances associées

Pour importer votre package, il vous suffit de faire:
```
import nom_dossier.nom_fichier
```

# Quelques détails sur la création de package

- Le fichier `__init__.py` peut être vide mais il peut aussi contenir des informations
- Ce fichier est lancé à chaque chargement du package, il peut inclure des dépendances, des vérifications de versions, des import vers les fonctions et classes des fichiers de votre package...


- Où peut-on mettre nos packages ?
    - Par défaut, si le package se trouve dans le même répertoire que le script exécuté, ça fonctionne
    - Le package doit se trouver dans un répertoire lié au PythonPath
    - Pour rechercher les répertoire, on utilise le module `sys` et la fonction `path`
    - Pour créer un répertoire "temporaire", on utilise la fonction `path.insert()` du module `sys`

# Bonnes pratiques Python

# Zen of Python

- Beautiful is better than ugly.
- Explicit is better than implicit.
- Simple is better than complex.
- Complex is better than complicated.
- Flat is better than nested.
- Sparse is better than dense.
- Readability counts.
- Special cases aren't special enough to break the rules.
- Although practicality beats purity.
- Errors should never pass silently.
- Unless explicitly silenced.
- In the face of ambiguity, refuse the temptation to guess.
- There should be one-- and preferably only one --obvious way to do it.
- Although that way may not be obvious at first unless you're Dutch.
- Now is better than never.
- Although never is often better than *right* now.
- If the implementation is hard to explain, it's a bad idea.
- If the implementation is easy to explain, it may be a good idea.
- Namespaces are one honking great idea -- let's do more of those!

https://www.python.org/dev/peps/pep-0020/

# Le plus important

- "Build tools for others that you want to be built for you." - Kenneth Reitz
- "Simplicity is alway better than functionality." - Pieter Hintjens
- "Fit the 90% use-case. Ignore the nay sayers." - Kenneth Reitz
- "Beautiful is better than ugly." - PEP 20
- Build for open source (even for closed source projects).

# Remarques générales sur le développement

- "Explicit is better than implicit" - PEP 20
- "Readability counts." - PEP 20
- "Anybody can fix anything." - Khan Academy Development Docs
- Fix each broken window (bad design, wrong decision, or poor code) as soon as it is discovered.
- "Now is better than never." - PEP 20
- Test ruthlessly. Write docs for new features.
- Even more important that Test-Driven Development--Human-Driven Development
- These guidelines may--and probably will--change.

# Bonnes pratiques Python

PEP8 vous aidera mais certains points sont centraux : https://www.python.org/dev/peps/pep-0008/


## L'indentation en python :
- 4 espaces
- pas de  tabulations


# Nommage

- Variables, fonctions, méthodes, packages, modules :
`lower_case_with_underscores`
- Classes et Exceptions
`CapWords`
- Méthodes protégées et fonctions internes :
`_single_leading_underscore(self, ...)`
- Méthode privées :
`__double_leading_underscore(self, ...)`
- Constantes
`ALL_CAPS_WITH_UNDERSCORES`

D'autres règles :
- on écite les nom trop courts
- les noms doivent traduire clairement ce que fait l'objet

# Bonnes pratiques

- Les sauts de lignes
    - On sépare des fonctions ou des classes par deux lignes
    - On sépare les méthodes d’une classe par un ligne
- Les imports
    - Un import par ligne
    - Tous les imports en haut du fichier .py
    - Les imports sont séparés en 3 parties
        1. Imports de modules Python (`import sys`)
        2. Imports de packages tiers (`import numpy as np`)
        3. Imports de modules personnels (`import mon_pkg as mp`)

# Les chemins

On peut utiliser soit le module os ou pathlib, soit `/`, soit `\\`

In [10]:
import os
from pathlib import Path
path1="../data/"
path2="c:\\user\\"
path3=Path(path1)

# Les commentaires

- Plus de commentaires ne veut pas dire plus de qualité
- Un bon code en Python c'est :
    - Peu de commentaires
    - Un code très lisible
    - Des docstrings extrêmement détaillés
- Mieux vaut pas de commentaire qu’un commentaire faux -> mettez à jour vos commentaires
- Evitez dans la mesure du possible les commentaires en fin de ligne
- Lorsqu’il s’agit d’explications sur des fonctions ou des classes, on utilise des docstring

In [1]:
# bien
def ma_fonction(liste1):
    """ Cette fonction permet de faire la somme des éléments d'une liste """
    
    #on vérifie qu'on a bien des nombres
    if all(isinstance(x, (int, float)) for x in liste1):
        return sum(liste1)
    else:
        print("La liste doit être composée de nombres")

In [None]:
ma_fonction()

In [2]:
from sklearn.cluster import KMeans

In [8]:
KMeans?

In [16]:
# encore mieux
def ma_fonction2(liste1):
    """ Cette fonction permet de faire la somme des éléments d'une liste """
    try:
        return sum(liste1)
    except TypeError:
        print("La liste doit être composée de nombres")

In [9]:
import numpy as np

In [10]:
array1=np.random.randn(1000)

In [12]:
type(array1)

numpy.ndarray

In [13]:
array1.mean()

0.030274965701882026

In [14]:
np.mean(array1)

0.030274965701882026

In [15]:
from statsmodels.stats.weightstats import DescrStatsW

In [16]:
DescrStatsW??

# La documentation

Les commentaires et la documentation sont très liés.

- On utilisera les docstrings de Python pour générer de la documentation.
- On se basera sur les bonnes pratiques de http://www.python.org/dev/peps/pep-0257/
- **reStructured Text** et **Sphinx** seront des outils centraux

Les docstrings pour des fonctions ou des méthodes simples peuvent être écrits sur une seule ligne. Sinon, on structurera le docstring.



In [1]:
def train(train_data):
    """Train a model to classify Foos and Bars.

    Usage::

        >>> data = [("green", "foo"), ("orange", "bar")]
        >>> classifier = model.train(data)

    :param train_data: A list of tuples of the form ``(color, label)``.
    :rtype: A :class:`Classifier <Classifier>`
    """
    return train_data