<!-- dom:TITLE: Chapitre 1 : Les bases de la programmation avec Python (Partie 5) -->
# Chapitre 1 : Les bases de la programmation avec Python (Partie 5)
<!-- dom:AUTHOR: Ahmed Ammar at Institut Préparatoire aux Études Scientifiques et Techniques, Université de Carthage. -->
<!-- Author: -->  
**Ahmed Ammar**, Institut Préparatoire aux Études Scientifiques et Techniques, Université de Carthage.


Date: **Nov 14, 2020**

# Dictionnaires, tuples et sets
Jusqu'à maintenant nous avons vu et manipulé le type d'objet séquentiel le plus classique : les listes. On se rappelle qu'elles sont modifiables, ordonnées et itérables. Dans ce chapitre nous allons voir trois nouveaux types d'objet séquentiel avec des propriétés différentes : les dictionnaires, les tuples et les sets.
**Notice.**

Les objets séquentiels peuvent être aussi appelés parfois **conteneurs** (ou containers, en anglais).


## Dictionnaires
### Définition

Les **dictionnaires** se révèlent très pratiques lorsque vous devez manipuler des structures complexes à décrire et que les listes présentent leurs limites. Les dictionnaires sont des collections non ordonnées d'objets, c'est-à-dire qu'il n'y a pas de notion d'ordre (i.e. pas d'indice). On accède aux **valeurs** d'un dictionnaire par des **clés**. Ceci semble un peu confus ? Regardez l'exemple suivant :

In [None]:
ani1 = {}
ani1["nom"] = "girafe"
ani1["taille"] = 5.0
ani1["poids"] = 1100
ani1

In [None]:
ani1["poids"] = 1000 # la clé existe -> c'est une modification
ani1

En premier, on définit un dictionnaire vide avec les accolades `{}` (tout comme on peut le faire pour les listes avec `[]`). Ensuite, on remplit le dictionnaire avec différentes clés (`"nom"`, `"taille"`, `"poids"`) auxquelles on affecte des valeurs (`"girafe"`, `5.0`, `1100`). Vous pouvez mettre autant de clés que vous voulez dans un dictionnaire (tout comme vous pouvez ajouter autant d'éléments que vous voulez dans une liste).
____
**Notice.**

Un dictionnaire est affiché sans ordre particulier.
___

On peut supprimer un couple clé / valeur via l'instruction  `del dico[cle]`:

In [None]:
del ani1["poids"]
ani1

Il est également possible d’utiliser la méthode `pop()` :

In [None]:
ani1.pop("taille")

In [None]:
ani1

On peut aussi initialiser toutes les clés et les valeurs d'un dictionnaire en une seule opération :

In [None]:
ani2 = {"nom":"singe", "poids":70, "taille":1.75}

Mais rien ne nous empêche d'ajouter une clé et une valeur supplémentaire :

In [None]:
ani2["age"] = 15
ani2

Pour récupérer la valeur associée à une clé donnée, il suffit d'utiliser la syntaxe suivante `dictionnaire["cle"]`. Par exemple :

In [None]:
ani2["nom"]

__________
**Notice.**

Toutes les clés de dictionnaire utilisées jusqu'à présent étaient des chaînes de caractères. Rien n'empêche d'utiliser d'autres types d'objets comme des entiers (voire même des tuples, cf. paragraphe suivant), cela peut parfois s'avérer très utile.

Néanmoins, nous vous conseillons, autant que possible, d'utiliser systématiquement des chaînes de caractères pour vos clés de dictionnaire.
______

Après ce premier tour d'horizon, on voit tout de suite l'avantage des dictionnaires. Pouvoir retrouver des éléments par des noms (clés) plutôt que par des indices. Les humains retiennent mieux les noms que les chiffres. Ainsi, l'usage des dictionnaires rend en général le code plus lisible. Par exemple, si nous souhaitions stocker les coordonnées $(x,y,z)$ d'un point dans l'espace : `coors = [0, 1, 2]` pour la version liste, `coors = {"x": 0, "y": 1, "z": 2}` pour la version dictionnaire. Un lecteur comprendra tout de suite que `coors["z"]` contient la coordonnée z, ce sera moins intuitif avec `coors[2]`.

### Itération sur les clés pour obtenir les valeurs

Il est possible d'obtenir toutes les valeurs d'un dictionnaire à partir de ses clés :

In [None]:
ani2 = {'nom':'singe', 'poids':70, 'taille':1.75}
for key in ani2:
    print(key, ani2[key])

### Méthodes `.keys()`, `.values()` et `.items()`

Les méthodes `.keys()` et `.values()` renvoient, comme vous pouvez vous en doutez, les clés et les valeurs d'un dictionnaire :

In [None]:
ani2.keys()

In [None]:
ani2.values()

Les mentions `dict_keys` et `dict_values` indiquent que nous avons à faire à des objets un peu particuliers. Ils ne sont pas indexables (on ne peut pas retrouver un élément par indice, par exemple `dico.keys()[0]` renverra une erreur). Si besoin, nous pouvons les transformer en liste avec la fonction `list()` :

In [None]:
ani2.values()

In [None]:
list(ani2.values())

Toutefois, ce sont des objets " itérables ", donc utilisables dans une boucle.

Enfin, il existe la méthode `.items()` qui renvoie un nouvel objet `dict_items` :

In [None]:
dico = {0: 't', 1: 'o', 2: 't', 3: 'o'}
dico.items()

Celui-ci n'est pas indexable (on ne peut pas retrouver un élément par un indice) mais il est itérable :

In [None]:
dico.items()[2]

In [None]:
for key, val in dico.items():
    print(key, val)

Notez la syntaxe particulière qui ressemble à la fonction `enumerate()` vue dans la partie **10. Instructions itératives**. On itère à la fois sur `key` et sur `val`. On verra plus bas que cela peut-être utile pour construire des dictionnaires de compréhension.

### Existence d'une clé

Pour vérifier si une clé existe dans un dictionnaire, on peut utiliser le test d'appartenance avec l'instruction `in` qui renvoie un booléen :

In [None]:
if "poids" in ani2:
    print("La clé 'poids' existe pour ani2")

In [None]:
if "age" in ani2:
    print("La clé 'age' existe pour ani2")

Dans le second test, le message n'est pas affiché car la clé age n'est pas présente dans le dictionnaire `ani2`.

### Liste de dictionnaires

En créant une liste de dictionnaires qui possèdent les mêmes clés, on obtient une structure qui ressemble à une base de données :

In [None]:
animaux = [ani1, ani2]
animaux

In [None]:
for ani in animaux:
    print(ani['nom'])

Vous constatez ainsi que les dictionnaires permettent de gérer des structures complexes de manière plus explicite que les listes.

### Fonction `dict()`

La fonction `dict()` va convertir l'argument qui lui est passé en dictionnaire. Il s'agit donc d'une fonction de casting comme `int()`, `str()`, etc. Toutefois, l'argument qui lui est passé doit avoir une forme particulière : un objet séquentiel contenant d'autres objets séquentiels de 2 éléments. Par exemple, une liste de listes de 2 éléments :

In [None]:
liste_animaux = [["girafe", 2], ["singe", 3]]
dict(liste_animaux)

Ou un `tuple` de tuples de 2 éléments (cf. paragraphe suivant pour la définition d'un `tuple`), ou encore une combinaison liste / `tuple` :

In [None]:
tuple_animaux = (("girafe", 2), ("singe", 3))
dict(tuple_animaux)

In [None]:
dict([("girafe", 2), ("singe", 3)])

Si un des sous-éléments a plus de 2 éléments (ou moins), Python renvoie une erreur :

In [None]:
dict([("girafe", 2), ("singe", 3, 4)])

### Mettre à jour un dictionnaire à partir d'un autre : méthode `.update()`

La méthode update permet de **fusionner deux dictionnaires**.

In [1]:
a = {'nom': 'Ammar'}
b = {'prenom': 'Ahmed'}
a.update(b)
print(a)

{'nom': 'Ammar', 'prenom': 'Ahmed'}


### Créer une copie indépendante d'un dictionnaire : méthode `.copy()`

Comme pour toute variable, vous ne pouvez pas copier un dictionnaire en faisant `dic1 = dic2` :

In [2]:
d = {"k1":"Ammar", "k2":"Ahmed"}
e = d
d["k1"] = "XXX"
e

{'k1': 'XXX', 'k2': 'Ahmed'}

Pour créer une copie indépendante vous pouvez utiliser la méthode copy :

In [4]:
d = {"k1":"Ammar", "k2":"Ahmed"}
e = d.copy()
d["k1"] = "XXX"
e

{'k1': 'Ammar', 'k2': 'Ahmed'}

## Tuples
### Définition

Les **tuples** (" **n-uplets** " en français) correspondent aux listes à la différence qu'ils sont **non modifiables**. On a vu dans la partie **11.2
Listes : list** que les listes pouvaient être modifiées par références, notamment lors de la copie de listes. Les tuples s'affranchissent de ce problème puisqu'ils sont non modifiables. Pratiquement, ils utilisent les parenthèses au lieu des crochets :

In [None]:
x = (1, 2, 3)
x

In [None]:
x[2]

In [None]:
x[0:2]

In [None]:
x[2] = 15

L'affectation et l'indiçage fonctionnent comme avec les listes. Mais si on essaie de modifier un des éléments du tuple, Python renvoie un message d'erreur. Si vous voulez ajouter un élément (ou le modifier), vous devez créer un autre tuple :

In [None]:
x = (1, 2, 3)
x + (2,)

___
**Notice.**

Pour utiliser un tuple d'un seul élément, vous devez utiliser une syntaxe avec une virgule (element,), ceci pour éviter une ambiguïté avec une simple expression.

Autre particularité des tuples, il est possible d'en créer de nouveaux sans les parenthèses, dès lors que ceci ne pose pas d'ambiguïté avec une autre expression :

In [None]:
x = (1, 2, 3)
x

In [None]:
x = 1, 2, 3
x

Toutefois, nous vous conseillons d'utiliser systématiquement les parenthèses afin d'éviter les confusions.
___

Enfin, on peut utiliser la fonction `tuple(sequence)` qui fonctionne exactement comme la fonction `list()`, c'est-à-dire qu'elle prend en argument un objet séquentiel et renvoie le tuple correspondant (opération de casting) :

In [None]:
tuple([1,2,3])

In [None]:
tuple("ATGCCGCGAT")

___
**Notice.**

Les listes, les dictionnaires et les tuples sont des objets qui peuvent contenir des collections d'autres objets. On peut donc construire des listes qui contiennent des dictionnaires, des tuples ou d'autres listes, mais aussi des dictionnaires contenant des tuples, des listes, etc.
___


### Itérations sur plusieurs valeurs à la fois

Pratiquement, nous avons déjà croisé les tuples avec la fonction `enumerate()` dans la partie **10. Instructions itératives**. Cette dernière permettait d'itérer en même temps sur les indices et les éléments d'une liste (ou d'une chaîne de caractères):

In [None]:
for i, elt in enumerate([75, -75, 0]):
    print(i, elt)

In [None]:
for obj in enumerate([75, -75, 0]):
    print(obj, type(obj))

En fin de compte, la fonction `enumerate()` itère sur une série de tuples. Pouvoir séparer `i` et `elt` dans la boucle est possible du fait que Python autorise l'affectation multiple du style `i, elt = 0, 75` (cf. rubrique suivante).

Dans le même ordre d'idée, nous avons vu à la rubrique précédente la méthode `.dict_items()` qui permettait d'itérer sur des couples clé / valeur d'un dictionnaire :

In [None]:
dico = {"pinson": 2, "merle": 3}
for key, val in dico.items():
    print(key, val)

In [None]:
for obj in dico.items():
    print(obj, type(obj))

On voit que cette méthode `.dict_items()` itère comme `enumerate()` sur une série de tuples.

Sur la même base, on peut finalement itérer sur 3 valeurs en même temps à partir d'une liste de tuples de 3 éléments :

In [None]:
liste = [(i, i+1, i+2) for i in range(5, 8)]
liste

In [None]:
for x, y, z in liste:
    print(x, y, z)

On pourrait concevoir la même chose sur 4 éléments, ou finalement autant que l'on veut. La seule restriction est d'avoir une correspondance systématique entre le nombre de variables d'itération (par exemple 3 ci-dessus avec `x, y, z`) et la longueur de chaque sous-tuple de la liste sur laquelle on itère (chaque sous-tuple a 3 éléments ci-dessus).

### Affectation multiple et le nom de variable

L'affectation multiple est un mécanisme très puissant et important en Python. Pour rappel, il permet d'effectuer sur une même ligne plusieurs affectations en même temps, par exemple : `x, y, z = 1, 2, 3`. On voit que cette syntaxe correspond à un `tuple` de chaque côté de l'opérateur =. Notez qu'il serait possible de le faire également avec les listes : `[x, y, z] = [1, 2, 3]`. Toutefois, cette syntaxe est alourdie par la présence des crochets. On préférera donc la première syntaxe avec les tuples sans parenthèse.
___
**Notice.**

Nous avons appelé l'opération `x, y, z = 1, 2, 3` affectation multiple pour signifier que l'on affectait des valeurs à plusieurs variables en même temps. Toutefois, vous pourrez rencontrer aussi l'expression *tuple unpacking* que l'on pourrait traduire par *"désempaquetage de tuple"*. Cela signifie que l'on décompose le tuple initial `1, 2, 3` en 3 variables différentes (comme si on vidait son sac à dos, d'où le terme désempaquetage !).
___


### Tuples en compréhension

On dit qu'on construit un tuple en compréhension lorsqu'on le définit en appliquant une fonction `tuple` à une séquence d'éléments.

Voici à titre d'exemple plus complexe, le tuple des carrés des 10 premiers entiers positifs ou nuls. Il est construit à l'aide de l'expression `i*i` dans laquelle `i` prend les valeurs successives `0, 1, ..., 9` (grâce à la boucle `for`).

In [None]:
tuple(i*i for i in range(10))

**Notice.**

Sans le constructeur `tuple`, la construction en compréhension produit un générateur et non pas un tuple.



## Sets
Les conteneurs de type `set` représentent un autre type d'objet séquentiel qui peut se révéler très pratique. Ils ont la particularité d'être non modifiables, non ordonnés et de ne contenir qu'une seule copie maximum de chaque élément. Pour créer un nouveau set on peut utiliser les accolades :

In [None]:
s = {1, 2, 3, 3}
s

In [None]:
type(s)

Notez que la répétition du 3 dans la définition du `set` en ligne 1 donne au final un seul 3 car chaque élément ne peut être présent qu'une seule fois. A quoi différencie-t-on un set d'un dictionnaire alors que les deux utilisent des accolades ? Le set sera défini seulement par des valeurs `{val1, val2, ...}` alors que le dictionnaire aura toujours des couples clé/valeur `{clé1: val1, clé2: val2, ...}`.

En général, on utilisera la fonction interne à Python `set()` pour générer un nouveau set. Celle-ci prend en argument n'importe quel objet itérable et le convertit en set (opération de *casting*) :

In [None]:
set([1, 2, 4, 1])

In [None]:
set((2, 2, 2, 1))

In [None]:
set(range(5))

In [None]:
set({"clé1": 1, "clé2": 2})

In [None]:
set(["ti", "to", "to"])

In [None]:
set("Maître corbeau sur un arbre perché")

Nous avons dit plus haut que les sets ne sont pas ordonnés, il est donc impossible de récupérer un élément par sa position. Il est également impossible de modifier un de ses éléments. Par contre, les sets sont itérables :

In [None]:
s = set([1, 2, 4, 1])
s[1]

In [None]:
for elt in s:
    print(elt)

Les conteneurs de type `set` sont très utiles pour rechercher les éléments uniques d'une suite d'éléments. Cela revient à éliminer tous les doublons. Par exemple :

In [None]:
import random as rd
l = [rd.randint(0, 9) for i in range(10)]
l

In [None]:
set(l)

On peut bien sûr transformer dans l'autre sens un set en liste. Cela permet par exemple d'éliminer les doublons de la liste initiale tout en récupérant une liste à la fin :

In [None]:
list(set([7, 9, 6, 6, 7, 3, 8, 5, 6, 7]))

On peut faire des choses très puissantes. Par exemple, un compteur de lettres en combinaison avec une liste de compréhension, le tout en une ligne !

In [None]:
seq = "atctcgatcgatcgcgctagctagctcgccatacgtacgactacgt"
set(seq)

In [None]:
[(base, seq.count(base)) for base in set(seq)]

Les sets permettent aussi l'évaluation **d'union** ou **d'intersection** mathématiques en conjonction avec les opérateurs respectivement `|` et `&` :

In [None]:
l = [3, 3, 5, 1, 3, 4, 1, 1, 4, 4]
l2 = [3, 0, 5, 3, 3, 1, 1, 1, 2, 2]
set(l) & set(l2)

In [None]:
set(l) | set(l2)

## Dictionnaires et sets de compréhension
Nous avons vu dans la partie 11.2 (Listes : `list`) les listes de compréhension. Il est également possible de générer des dictionnaires de compréhension :

In [None]:
dico = {'a': 10, 'g': 10, 't': 11, 'c': 15}
dico.items()

In [None]:
{key:val*2 for key, val in dico.items()}

In [None]:
{key:val for key, val in enumerate("toto")}

In [None]:

seq = "atctcgatcgatcgcgctagctagctcgccatacgtacgactacgt"
{base:seq.count(base) for base in set(seq)}

De manière générale, tout objet sur lequel on peut faire une double itération du type `for var1, var2 in obj` est utilisable pour créer un dictionnaire de compréhension.

Il est également possible de générer des *sets* de compréhension sur le même modèle que les listes de compréhension :

In [None]:
{i for i in range(10)}

In [None]:
{i**2 for i in range(10)}