[(précédent)](02%20-%20Python%20basics.ipynb) | [(index)](00%20-%20Introduction%20to%20Python.ipynb) | [(suivant)](04%20-%20Python%20tools%20for%20data%20analysis.ipynb)

# Python niveau intermédiaire

<div class="alert alert-block alert-warning">
    <b>Objectifs d'apprentissage :</b>
    <br>
    <ul>
        <li>Développer et utiliser du code réutilisable en l'encapsulant dans des fonctions.</li>
        <li>Empaqueter des fonctions dans des classes souples et extensibles.</li>
        <li>Appliquer des clôtures (*closure*) et des décorateurs à des fonctions pour en modifier le comportement.</li>
    </ul>
</div>

Dans le [module précédent](02%20-%20Python%20basics.ipynb), le code se limitait à de courts blocs. Pour résoudre des problèmes plus complexes, il faudra souvent du code pouvant s'étendre sur des centaines voire des milleirs de lignes de code. Pour pouvoir réutiliser ce code, il ne serait pas pratique de devoir le copier et coller de nombreuses fois. Pire encore, cela signifierait que toute erreur serait amplifiée, et les modifications à apporter au code seraient difficiles à gérer.

Il vaudrait beaucoup mieux avoir un module qui représente une tâche donnée, le perfectionner, et l'appeler pour résoudre un problème donné ou exécuter une opération donnée.

En développement logiciel, cette approche de regrouper des fonctions en un code modulaire est appelé "abstraction". Un système logiciel complet consiste d'un certain nombre de modules interagissants pour créer une expérience intégrée.

En Python, ces modules sont appelées fonctions (`function`) et un ensemble complet de fonctions regreoupées autour d'une série de tâches liées est appelé bibliothèque ou module. Les bibliothèques permettent d'hériter d'une vaste variété de solutions logicielles développées et maintenues par d'autres gens.

Python est [open source](https://en.wikipedia.org/wiki/Open-source_software), ce qui signifie que son code source est mis à disposition sous une license qui permet à quiconque d'étudier, modifier et  distribuer le logiciel à tout le monde pour n'importe quel but. De nombreuses bibliothèques Python sont elles aussi open source. Il y ainsi des milliers de bibliothèques que vous pouvez utiliser, et, lorsque vous vous en sentirez capables, auxquelles vous pouvez contribuer.

## Fonctions

Les fonctions sont des modules de code exécutables, dont certaines peuvent prendres des paramères ou arguments (à savoir des variables que vous fournissez à la fonction), qui effectue une tâche et renvoie une valeur. Elles permettent d'organiser le code en blocs individuels, ce qui améliore la lisibilité du programme et permet de gagner du temps.

Ces fonctions peuvent aussi facilement être partagées avec d'autres programmeurs, ce qui peut leur faire gagner du temps aussi.
<br>
<div class="alert alert-block alert-info">
    <b>Syntaxe</b>
    <br>
    <ul>
        <li>Une fonction est structurée par l'instruction `def` :</li>
        `def function_name(parameters):
         code
         return response`
        <li>`return` est optionnel, mais permet de renvoyer les résultats d'une tâche réalisée par la fonction au moment de son invocation</li>
        <li>Pour déterminer si un objet test une fonction (c'est à dire peut être invoqué - *callable*), utiliser `callable`, par ex. `callable(function)` renvoie  `True`</li>
    </ul>
</div>

In [None]:
# Une fonction simple sans arguments 
def say_hello():
    print("Bonjour le monde !")

# On l'invoque simplement avec
say_hello()

# Et on vérifie qu'elle est invoquable
print(callable(say_hello))

Un argument peut être n'importe quelle variable, telle que des entiers, des chaînes de caractères, des listes, des dictionnaires ou même des fonctions. Ceci souligne l'importance de laisser des commentaires et explications dans le code pour s'assurer que les utilisateurs de la fonction puissent savoir quelles variables la fonction attend et dans quel ordre.

Les fonctions peuvent aussi effectuer des calcules et renvoyer les résultats au code qui les ont invoquées.

In [None]:
# Une fonction à deux arguments
def say_hello_to_user(username, greeting):
    # Renvoie une salutation à un utilisateur
    print("Bonjour, {} ! J'espère que vous passez une excellente {}.".format(username, greeting))

# On l'invoque
say_hello_to_user("Jill", "journée")

# On effectue un calcul et on le renvoie
def sum_two_numbers(x, y):
    # Renvoie la somme de x + y 
    return x + y

sum_two_numbers(5, 10)

On peut voir qu'échanger les valeurs `username` et `greeting` dans la fonction `say_hello_to_user` donnerait des résultats inattendus, mais qu'un tel échange n'affecterait pas la fonction `sum_two_numbers`.

Non seulement vous pouvez invoquer des fonctions depuis une fonction, mais vous pouvez créer des variables qui contiennent des fonctions ou des fonctions qui renvoie des fonctions.

In [None]:
def number_powered(number, exponent):
    # Renvoie un nombre porté  à la puissance d'un autre
    return number ** exponent

# Les fonctions définies dans des cellules précédentes de Jupyter restent disponibles
# Cela implique que  `sum_two_numbers` est encore disponible ici
def sum_and_power(number1, number2, exponent):
    # Renvoie la somme de deux nombres portée à une puissance
    summed = sum_two_numbers(number1, number2)
    return number_powered(summed, exponent)

# Inovque `sum_and_power`
print(sum_and_power(2, 3, 4))

En utilisant des noms explicites et des commentaires, il est posible de garder un code clair et lisible.

Une meilleure manière d'écrire des commentaires pour une fonction est d'utiliser le mécanisme des `docstrings`. 
<div class="alert alert-block alert-info">
    <b>Syntaxe</b>
    <br>
    <ul>
        <li>Les *docstrings* sont créées avec du texte compris entre une série de 3 guillemets, par exemple `""" Ceci est une docstring """`</li>
        <li>On peut accéder à la docstring d'une fonction via `function.__doc__`</li>
    </ul>
</div>

In [None]:
def docstring_example():
    """
    Un exemple d'une fonction qui renvoie `True`.
    """
    return True

# Affichage de la  docstring
print(docstring_example.__doc__)

# Invocation de la fonction
print(docstring_example())

## Classes et Objets

Un objet Python complet encapsule des variables et des fonctions dans une entité unique. Les objets obtiennent ces variables et fonctions de modèles appelés `classes`.

Les classes fournissent le lieu où la majeur partie du code est exécuté en Python, et la programmation en Python consiste en grande partie à créer et utiliser des classes pour effectuer des tâches. 

Une classe très simple ressemble à ceci :

In [None]:
class myClass:
    """
    A demonstration class.
    """
    my_variable = "Regardez, une variable !"
    
    def my_function(self):
        """
        A demonstration class function.
        """
        return "Je suis une fonction de classe !"

# Pour invoquer une classe, on crée un nouvel objet qui instancie cette classe
new_class = myClass()

# Les fonctions et les variables défines dans la classe sont accessibles en utilisant un point
print(new_class.my_variable)
print(new_class.my_function())

# Pour accéder à la docstring de la classe
print(myClass.__doc__)
print(myClass.my_function.__doc__)

Dans le détail de cette nouvelle syntaxe :
<div class="alert alert-block alert-info">
    <b>Syntaxe</b>
    <br>
    <ul>
        <li>Pour instancier une classe, on invoque `class()`. Invoquer `class` sans les parenthèses donne accès à l'objet classe lui même. Cela aussi peut s'avérer utile, par exemple pour passer une classe en tant que variable.</li>
        <li>On accède à toutes les variables et les fonctions d'une classe avec une invocation à point, `.function()` ou `.variable`. De nouvelles fonctions et variables peuvent être ajouté à une instance de classe déjà créée. En revanche, ces ajouts seront limités à cette instance, pas aux autres instances créées par ailleurs.</li>
        <li>Les fonctions à l'intérieur d'une classe prennent toujours un argument de base, appelé par convention `self`. Les raisons pour lesquelles `self` est nécessaire sont complexes, mais pour faire simple, il suffit de penser à `self`comme étant l'objet lui-même. Ainsi, à l'intérieur d'une classe, `self.function` est la façon d'invoquer une fonction de cette classe.</li>
        <li>Les *docstring*s sont disponibles comme elles le sont pour les fonctions.</li>
    </ul>
</div>

In [None]:
# Ajouter une nouvelle variable à une instance de classe
new_class1 = myClass()
new_class1.my_variable2 = "Bonjour, Bob !"
print(new_class1.my_variable2, new_class1.my_variable)

# En revanche, accéder à  my_variable2 dans new_class génère une erreur causes an error
print(new_class.my_variable2)

Les classes peuvent être initialisées avec un jeu de variables disponibles. Cela permet de passer des arguments à l'instanciation de la classe pour en initialiser les variables.
<div class="alert alert-block alert-info">
    <b>Syntaxe</b>
    <br>
    <ul>
        <li>Initialiser une classe avec la fonction spéciale `def __init__(self)`</li>
        <li>Passer des arguments à vos classes avec `__init__(self, arguments)`</li>
        <li>On peut aussi distinguer entre les *arguments*, et les arguments à mots-clefs (*keywoard arguments*) :</li>
        <ul>
            <li>**arguments**: ceux-ci sont passés de manière classique, en un seul terme, par ex. `my_function(argument)`.</li>
            <li>**keyword arguments**: ceux-ci sont passés d'une façon similaire aux entrées d'un dictionnaire, par ex `my_function(keyword_argument = value)`. Cela permet aussi de définit une valeur par défaut pour un argument. Si aucune valeur n'est donné pour l'argument en question, la valeur par défaut sera utilisé sans générer d'erreur pour la fonction.</li>
            <li>Certaines fonctions nécessitent de nombreux arguments et arguments à mots-clefs lors de leur invocation, ce qui peut rendre les choses compliquées. On peut dans ce cas considérer les arguments comme une liste de valeurs, et les arguments à mots-clefs comme un dictionnaire. Cela est possible dans le code de la façon suivante : `my_function(*args, **kwargs)` où `*args` sera une liste de valeurs ordonnées, et `**kwargs` un dictionnaire.</li>
        </ul>
    </ul>
</div>

In [None]:
# Une demonstration de tous ces nouveaux concepts

class demoClass:
    """
    A demonstration class with an __init__ function, and a function that takes args and kwargs.
    """
    
    def __init__(self, argument = None):
        """
        A function that is called automatically when the demoClass is initialised.
        """
        self.demo_variable = "Bonjour le monde !"
        self.initial_variable = argument
        
    def demo_class(self, *args, **kwargs):
        """
        A demo class that loops through any args and kwargs provided and prints them.
        """
        for i, a in enumerate(args):
            print("Arg {}: {}".format(i+1, a))
        for k, v in kwargs.items():
            print("{} - {}".format(k, v))
        if kwargs.get(self.initial_variable):
            print(self.demo_variable)
        return True

demo1 = demoClass()
demo2 = demoClass("Bob")

# Comment ont été initialisés chacun des objets de démo ??
print(demo1.demo_variable, demo1.initial_variable)
print(demo2.demo_variable, demo2.initial_variable)

# Une démo du passage d'arguments comme liste et d'arguments à mots-clefs comme dictionnaire
args = ["Alice", "Bob", "Carol", "Dave"]
kwargs = {"Alice": "Ingénieur",
          "Bob": "Consultant",
          "Carol": "Avocat",
          "Dave": "Docteur"
         }
demo2.demo_class(*args, **kwargs)

Utiliser `*args` et `**kwargs` dans vos appels de fonction pendant que vous développez permet de changer votre code plus facilement, sans avoir à repasser sur toutes les lignes de code qui appelle la dite fonction si vous devez par exemple changer l'ordre ou le nombre des arguments appelés. 

Cela permet de réduire les erreurs, améliore la lisibilté et rend l'expérience de progrmmation plus agréable.

À ce stade, vous avez appris les fondamentaux de la syntaxe Python, ainsi que comment créer du code modulaire. Nous allons maintenant voir comment rendre le code réutilisable et facile à partager.

## Modules et Paquets

Un module en Python est un ensemble de classes ou de fonctions qui encapsulent un unique ensemble de tâches reliées. Les paquets sont des ensembles de modules assemblés dans une unité. On parle aussi de bibliothèque (*library*).

Pour créer un module, il suffit de sauvergader le code d'une classe dans un fichier avec une extension `.py` (comme un fichier texte utilise l'extension `.txt`).

### Écrire des  modules

Un ensemble de modules dans une bibliothèque nécessite un ensemble spécifique de besoins. S'il on souhaite par exemple développeur un jeu de ping pong, on pourrait placer la logique du jeu dans un module, et les fonctionnalités de visualisation dans un autre. Cela mènerait à une structure de fichiers telle que :

    pingpong/
    pingpong/game.py
    pingpong/draw.py

Chaque fichier contient un ensemble de fonctions. Imaginons que `draw.py` ait une fonction `draw_game`. La syntaxe pour importer cette fonction dans le fichier`game.py` serait alors :

    import draw
    
Cette commande importe l'intégralité du fichier `draw.py`. Après cela, les fonctions de ce fichier peuvent être invoquées avec par exemple `draw.draw_game`.

Alternativement, chaque fonction peut être importée individuellement :

    from draw import draw_game
    
Il viendra un moment où vous souhaiterez exécuter des programmes hors d'une interpréteur (tel que  Jupyter Notebook). Pour exécuter un programme en ligne de commande, celui-ci doit avoir une fonction spéciale appelée `main` qui sera invoquée comme suit :

    if __name__ == '__main__':
        main()
        
Pour récapituler, la syntaxe pour invoquer `game.py` en ligne de commande serait :

    # game.py
    # Importe la fonction draw_game définie dans draw.py
    from draw import draw_game

    def play_game():
        ...

    def main():
        result = play_game()
        draw_game(result)

    # Si ce script est exécuté, main() sera invoqué
    if __name__ == '__main__':
        main()

<div class="alert alert-block alert-info">
    <b>Syntaxe</b>
    <br>
    <ul>
        <li>Les fonctions et classes Python sont sauvegardées dans des fichiers avec l'extesion`.py` pour pouvoir être réutilisées</li>
        <li>Ces fonctions peuvent être importées de ces fichiers en totalité en utilisant soit`import filename` (sans l'extension `.py`), ou bien individuellement avec `from filename import class, function1, function2`</li>
        <li>Vous noterez peut-être que lorsque vous exécuter un programme, Python crée automatique un fichier du même nom mais avec une extesion `.pyc`. Il s'agit d'une version compilée du programme, générée automatiquement.</li>
        <li>Pour exécuter un programme en ligne de commande, il faut définir une fonction `main` et l'invoquer comme suit</li>
        `if __name__ == '__main__':
            main()`
        <li>Si un module définit un grand nombre de fonctions que vous comptez uiliser extensivement, vous pouvez définir un alias pour le module. Par exemple, nous utiliserons à répétition un module appelé `pandas` dans la section suivante. La convention veut qu'on l'importe sous l'alias `pd` avec `import pandas as pd`. Dans ce cas, vous aurez accès aux fonctions de `pandas` en utilisant l'invocation `pd.function`</li>
        <li>L'import de module peut être soumis à des conditions logiques. En utilisant un alias unique au travers des différentes conditions, il est possible d'invoquer des codes différents suivant le flux du programme.</li>        
    </ul>
</div>

En rassemblant tout cela dans un exemple en pseudo-code (non-exécutable) :

In [None]:
# game.py
# Importer le module draw
if visual_mode:
    # en mode visuel, on utilise des graphismes
    import draw_visual as draw
else:
    # In mode textuel, on affiche du texte
    import draw_textual as draw

def main():
    result = play_game()
    # En fonction de visual_mode, le rendu sera soit visuel soit textuel
    draw.draw_game(result)

Notez que bien le pseudo-code ne soit pas exécutable, cela ne gêne en rien Jupyter Notebook - il est donc tout à fait possible d'y expérimenter sur des bouts de code sans rien casser.

## Les modules pré-définis

Il existe un grand nombre de modules pré-definis. Jupyter Notebook fournit qui plus est une liste de modules tiers encore plus vaste que vous pourrez explorer.

<div class="alert alert-block alert-info">
    <b>Syntaxe</b>
    <br>
    <ul>
        <li>Après avoir importer un module, `dir(module)` permet de lister toutes les fonctions mises à disposition par ce module.</li>
        <li>On peut aussi lire les docstrings du module avec `help(module)`</li>
    </ul>
</div>

Explorons un module que nous allons apprendre à utiliser par la suite, `pandas`.

In [None]:
import pandas as pd

help(pd)

In [None]:
dir(pd)

## Écrire des paquets

Les paquets (*package*) sont des bibliothèques consitués de multiple modules et fichiers. Ils sont stockés dans des deossiers qui doivent suivre une exigence imporante : tout paquet est un dossier qui **doit** avoir un fichier d'initalisation appelé `__init__.py`.

Le fichier lui-même peut être complètement vide, mais il sera importé et exécuté lors de l'invocation de la fonction  `import`. Cela permet de définir des règles ou des initialisations à effectuer lors de la première importation du paquet.

Que se passe-t-il si une bibliothèque est importé à multiple reprises ? Python garde la trace de ces imports, et n'initialise une paquet qu'une seul fois.

Parmi les aspects utiles du fichier `__init__.py` est qu'il permet de limiter ce qui est effectivement importer lors de l'utilisation de la commande `from package import *`.

In [None]:
#__init__.py

__all__ = ["class1", "class2"]

Cela impliquera que `from package import *` n'importera en fait que `class1` et `class2`

Les deux sections suivant sont optionnelles, dans la mesure où, à ce stade de votre pratique de développement, il y a peu de chances que vous ayez à écrire du code de cette sorte ; il peut néanmois se révéler utile de voir des usages de Python un peu plus avancés.

## Clôtures (*closures*)

Python a une notion de portée de variable (*scope*). Les variables créées à l'intérieur d'une classe ou d'une fonction ne sont disponibles qu'à l'intérieur de cette classe ou fonction. Les variables sont disponibles dans la limite de la **portée** de leur invocation. Pour rendre des variables disponibles dans une fonction, on les fera passer comme arguments (comme vu précédemment).

Il est parfois nécessaire de partager un argument avec toutes les fonctions, et parfois il est souhaitable qu'une variable ne soit disponible que pour certaines fonctions spécifiques sans qu'elles soient disponibles par ailleurs. Les fonctions qui permettent cela sont appelée **clôtures**, et les clôtures sont un exemple de *fonctions imbriquées*.

Une fonction imbriquée est une fonction définie à l'intérieur d'une autre. Ces fonctions imbriquées ont accès aux variables définie à l'intérieur de la portée créée par la fonction parente.

In [None]:
def transmit_to_space(message):
    """
    This is the enclosing function
    """
    def data_transmitter():
        """
        The nested function
        """
        print(message)
    # La fonction parente appelle la fonction imbriquée
    data_transmitter()

transmit_to_space("Message de test")

Rappelons nous que les fonctions sont elles-mêmes des objets, il est donc possible de renvoyer une fonction imbriquée comme valeur de retour.

In [None]:
def transmit_to_space(message):
    """
    This is the enclosing function
    """
    def data_transmitter():
        """
        The nested function
        """
        print(message)
    # Renvoie un objet représentant la fonction imbriquée (notez l'absence de parenthèses)
    return data_transmitter

msg = transmit_to_space("Vers le soleil !")
msg()

## Decorateurs

Les clôtures peuvent paraître quelque peu ésotériques. Quel est leur raison d'être ?

Il faut y réfléchir en terme de modularité du code Python. Parfois, il est utile de pré-traiter des arguments avant qu'une fonction ne s'y attaque. Et plusieurs fonctions différentes peuvent avoir des besoins de pré-traitement (par exemple de validation) communs. Plutôt que de modifier chaque fonction, mieux vaut utiliser une clôture autour de cette fonction et ne renvoyer des données qu'une fois la clôture exécutée.

Prenons un exemple classique sur une site Web. Certaines fonctions ne doivent être exécutées que si l'utilisateur a les droits nécessaires. Vérifier cela dans chaque fonction est répétitif.

Python fournit une syntaxe qui permet d'envelopper une fonction dans une clôture. Cela est connu sous le nom de _décorateur_ (*decorator*), et prend la forme suivante :

    @decorator
    def functions(arg):
        return True

Ceci est équivalent à `function = decorator(function)`, ce qui est similare à la façon dans les clôtures sont structurées dans la section précédente.

Un exemple fantaisiste :

In [None]:
def repeater(old_function):
    """
    A closure for any function which, passed as `old_function`
    returns `new_function`
    """
    def new_function(*args, **kwds):
        """
        A demo function which repeats any function in the outer scope.
        """
        old_function(*args, **kwds)
        old_function(*args, **kwds)
    return new_function

# On utilise `repeater` comme décorateur ainsi
@repeater
def multiply(num1, num2):
    print(num1 * num2)

# Et exécution
multiply(6,7)

Cela permet de modifier les résultats, mais aussi les entrées.

In [None]:
def exponent_out(old_function):
    """
    This modification works on any combination of args and kwargs.
    """
    def new_function(*args, **kwargs):
        return old_function(*args, **kwargs) ** 2
    return new_function

def exponent_in(old_function):
    """
    This modification only works if we know we have one argument.
    """
    def new_function(arg):
        return old_function(arg ** 2)
    return new_function

@exponent_out
def multiply(num1, num2):
    return num1 * num2

print(multiply(6,7))

@exponent_in
def digit(num):
    return num

print(digit(6))

# Générons une erreur
@exponent_in
def multiply(num1, num2):
    return num1 * num2

print(multiply(6,7))

Les décorateurs permettent de vérifier qu'un argument passe un certain nombre de conditions avant d'exécuter la fonction.

In [None]:
def check_zero(old_function):
    """
    Check the argument passed to a function to ensure it is not zero.
    """
    def new_function(arg):
        if arg == 0: 
            raise (ValueError, "Argument zéro")
        old_function(arg)
    return new_function

@check_zero
def print_num(num):
    print(num)

print_num(0)

Parfois on peut souhaiter passer de nouveaux arguments à un décorateur pour pouvoir faire quelque chose avant d'exécuter la fonction. Pour cela, il faut des fonctions doublement imbriquées.

In [None]:
def multiply(multiplier):
    """
    Using the multiplier argument, modify the old function to return
    multiplier * old_function
    """
    def multiply_generator(old_function):
        def new_function(*args, **kwds):
            return multiplier * old_function(*args, **kwds)
        return new_function
    return multiply_generator

@multiply(3)
def return_num(num):
    return num

return_num(5)

Et cela conclut cette partie due tutoriel.

[(précédent)](02%20-%20Python%20basics.ipynb) | [(index)](00%20-%20Introduction%20to%20Python.ipynb) | [(suivant)](04%20-%20Python%20tools%20for%20data%20analysis.ipynb)