Le langage de programmation Python
==================================

Introduction
------------

Python est un langage de programmation créé en 1990 et dont la première version libre a été publiée sur le forum Usenet en 1991.

Il s'agit d'un langage interprété et moderne :

* **libre**
    * licence proche de la BSD
* **gratuit**
    * téléchargable sur *python.org*
* **interprété**
    * sa machine virtuelle de référence est CPython, une implémentation en C
    * il existe aussi Jython (au dessus d'une JVM)
    * ainsi que IronPython (pour .NET)
* **de haut niveau**
    * algorithmique proche du conceptuel ou du langage humain
    * résoud pour nous les problématiques matérielles
* **multi-paradigme**
    * impératif
    * objet
    * fonctionnel
    * ...
* **multi-plateformes**
    * supercalculateurs
    * unix
    * linux
    * windows
    * ...
* **à typage dynamique fort**
    * cf plus bas
* **très simple d'utilisation**
    * la marche d'entrée est relativement basse
    * par nature, des développeurs de différents horizons peuvent rapprocher son fonctionnement à ce qu'ils connaissent déjà
* **flexible**
    * ne contraint pas les développeurs
    * offre beaucoup de possibilités pour résoudre les problématiques
* **couverture technique et fonctionnelle extrêmement large**
    * piles incluses
    * bibliothèques externes packagées

In [None]:
print('Hello World')

Déclarer une variable
---------------------

In [None]:
nom_variable = "valeur de la variable"

Le signe **=** est un opérateur, il s'agit de l'opérateur d'affectation.

* l'opérande gauche est le nom de la variable, c'est à dire le contenant
* l'opérande droite est la valeur de la variable, c'est à dire le contenu

Cette valeur est un objet Python.

En Python, tout est objet, que ce soit un nombre, une chaîne de caractère ou même une fonction ou une classe.

Pour la suite du programme, à chaque fois que l'on utilise le nom de la variable, l'interpréteur va chercher sa valeur :

In [None]:
print(nom_variable)

Une nom de variable peut ainsi être utilisé comme opérande de droite :

In [None]:
a = nom_variable

Ici, **a** et **nom_variable** sont deux contenant désignant le même contenu.

En termes techniques, on dit qu'il s'agit de deux pointeurs vers le même objet.

Ceci se vérifie ainsi :

In [None]:
a is nom_variable

L'opérande de droite peut être une expression. Elle est alors évaluée avant d'être affectée :

In [None]:
a = nom_variable * 2

In [None]:
print(a)

Une des caractéristiques du langage Python est que le type de l'objet est porté par l'objet et non le nom de sa variable.

Ainsi, une variable peut, au cours de son existence, changer de type :

In [None]:
a = 2 + 4 * 100 ** (1/2)

In [None]:
print(a)

C'est ce que l'on entend lorsque l'on dit que **Python est un langage dynamique**.

Ceci dit, contrairement à PHP, il dispose d'un typage fort :

In [None]:
entier = 42
chaine = "42"
flottant = 42.0
entier is chaine

In [None]:
entier is flottant

In [None]:
entier == chaine

In [None]:
entier == flottant

***
Pour supprimer une variable, il suffit d'utiliser le mot clé **del**.

In [None]:
del nom_variable

Cette instruction détruit le pointeur qui n'existe alors plus :

In [None]:
print(nom_variable)

Par contre, l'objet existe toujours. Ainsi, si deux pointeurs pointent vers le même objet, le fait qu'un des pointeurs soit détruit ne change rien pour l'autre pointeur.

Python étant un langage de haut niveau, il dispose d'un ramasse-miettes qui se charge de faire le ménage. Chaque objet dispose d'un compteur de référence. Il sait donc à tout instant combien de pointeurs pointent vers lui.

Lorsqu'il n'y a plus aucun pointeur qui pointe vers un objet, ce dernier peut alors être supprimé par le ramasse miette lorsqu'il passera par là, mais il est impossible de prédire quand cela se produira. Ce processus est géré de manière optimale par la machine virtuelle Python.

Type d'une variable
-------------------

Une primitive extrêmement importante permet de connaître le type de la variable :

In [None]:
type('variable')

C'est le contenu qui contient le type de la variable.

Ici, on a utilisé des *guillemets* : on a dont affaire à une chaîne de caractères, dont le type est **str**.

In [None]:
type(42)

In [None]:
type(42.)

In [None]:
type(42j)

In [None]:
type('42')

In [None]:
type("42")

In [None]:
type("""
        42
""")

In [None]:
type(b'42')

In [None]:
type([])

In [None]:
type(())

In [None]:
type({})

In [None]:
type(set())

In [None]:
type({1: "a", 2: "b"})

In [None]:
type({1, 2, 3})

In [None]:
type(type), type(int), type(str)

Se débrouiller tout seul avec Python
------------------------------------

On a vu la primitive **type**, il existe également deux autres primitives très utiles qui sont **dir** et **help**.

In [None]:
dir([])

On peut voir que la liste dispose d'une méthode **sort**. En Python, tout est objet : une méthode est également un objet :

In [None]:
[].sort

Python renvoie ici le pointeur vers la méthode sort de la liste crée à la volée. Ce pointeur pointe vers la méthode de l'objet liste qui est elle aussi un objet.

Vu que c'est un objet, on peut l'utiliser en tant qu'argument de la fonction **help** :

In [None]:
help([].sort)

Voici un cas d'utilisation. On commence par déclarer une liste :

In [None]:
l = [5, 2, 7, 0, 1, 8, 9, 3, 6, 4]

On trie la liste :

In [None]:
l.sort()

La commande précédente n'a absolument rien renvoyé. Par contre, elle a modifié la variable elle-même.

C'est ce que la documentation appelle **in-place**.

In [None]:
print(l)

Si on veut garder la liste d'origine et obtenir une copie qui soit classée, il faut alors utiliser ceci :

In [None]:
l = [5, 2, 7, 0, 1, 8, 9, 3, 6, 4]
l2 = sorted(l)

On vérifie que la liste d'origine n'est pas modifiée :

In [None]:
print(l)

On vérifie que la liste obtenu est bien triée :

In [None]:
print(l2)

Au passage, on vient de voir que le tri en place d'une liste se fait en utilisant une méthode (paradigme objet) alors que le tri par duplication se fait en utilisant une fonction (paradigme impératif).

En Python, mélanger les paradigmes est naturel et il n'y a pas de règle qui dit qu'un paradigme est mieux qu'un autre. Il existe simplement des situations ou l'un des paradigme est plus naturel à utiliser qu'un autre.

Exercice 1
----------

* listez les méthodes d'une chaîne de caractères :
* identifiez la méthode permettant de remplacer un ou plusieurs caractères (en devinant par rapport à son nom)
* affichez la documentation de la fonction
* essayez la méthode à partir de la variable suivante :
    * Remplacez "à effectuer" par "correctement effectué"
* qu'observez-vous ?
    * il y a une différence de comportement entre cette méthode et la méthode **sort** d'une liste.

In [None]:
chaine = "Ceci est un test à effectuer"

In [None]:
print(chaine)

In [None]:
dir(chaine)

In [None]:
help(chaine.replace)

In [None]:
chaine.replace("e", "E", 4)

In [None]:
print(chaine)

In [None]:
chaine = chaine.replace("à effectuer", "correctement effectuée")

In [None]:
print(chaine)

L'exercice nous montre la différence entre les objets **mutables** et les objets **non mutables**. Les premiers sont fait pour être dynamique et leur représentation en mémoire peut changer à tout moment au grés des besoins. Les seconds ne changent jamais.

Une chaine de caractère en mémoire ne changera jamais. Si on la modifie, on crée en réalité une copie de la chaîne et le pointeur change d'adresse mémoire pour pointer vers la chaîne modifiée. Ainsi, les méthodes d'une chaîne de caractère renvoient une nouvelle chaîne sans jamais modifier l'objet courant. C'est parce que l'on utilise l'opérateur d'affectation que l'on *modifie* sa variable.

C'est aussi ce comportement qui fait que l'on peut chaîner les appels :

In [None]:
chaine.replace("Ceci", "Cela").replace("est", "sera")

Pour une liste, le pointeur ne changera jamais, quelque soit les opérations réalisées, à moins de faire explicitement une réaffectation. Il est donc facile de se tromper lorsque l'on n'a pas encore le langage en main :

In [None]:
l = [1, 3, 2, 4]
l = l.sort()
print(l)

La méthode ne renvoie bien. Donc elle renvoie en réalité un pointeur vers **None**.
Si on utilise un opérateur d'affectation, on affecte donc cette valeur là à notre liste et on perd ainsi la valeur de cette liste.

Pour la même raison, il n'est pas possible de chaîner les méthodes d'une liste.

Sont **non mutable** :

* les littéraux
    * entiers, flottants, nombres complexes, chaînes de caractères
    * les n-uplets
    * les objets *frozen*, comme les frozenset
    * les booléens et le None

Sont **mutables** tous les objets classiques Python, y compris ceux issus des classes que l'on écrit soi-même.

Exercice 2
----------

JSON est une technique de sérialisation de données, permettant de les échanger via le réseau, potentiellement entre des programmes hétérogènes.

* On a importé le module **json**
    * json est maintenant une variable
    * quel est son type ?
* donner la liste des méthodes du module
* donner le nom des deux fonctions principales permettant de sérialiser et désérialiser sans utiliser de fichier
    * pour cela, afficher l'aide des fonction
    * lire les signatures des fonctions du module
    * déduire les noms des fonctions dont on a besoin
    * les utiliser pour sérialiser et désérialiser les variables suivantes :

In [None]:
import json

In [None]:
data = [
    {
        "pk": 1,
        "label": "test",
    }, {
        "pk": 2,
        "label": "python",        
    }
]

In [None]:
serialized = '[{"pk": 1, "label": "test"}, {"pk": 2, "label": "python"}]'

---
Réponse de l'exercice.

In [None]:
type(json)

In [None]:
dir(json)

In [None]:
type(json.codecs)

In [None]:
type(json.dump)

In [None]:
help(json.dump)

In [None]:
help(json.dumps)

In [None]:
json.dumps(data)  # Sert à sérialiser

In [None]:
help(json.loads)

In [None]:
json.loads(serialized)  # Sert à désérialiser.

In [None]:
obj = json.loads(serialized)

In [None]:
print(obj)

In [None]:
type(obj)

In [None]:
len(obj)