# DICTIONNAIRES Terminale : rappels de première

Un dictionnaire est une _structure de données_ permettant le stockage de données.
C'est un tableau associatif, comme l'est un dictionnaire de langue française ou un index dans un livre dans lesquels on recherche un mot pour obtenir une description ou le numéro d'une page.

Un élément du dictionnaire est un couple `(clé, valeur)`.

L'interface d'un dictionnaire se compose de :
 - sa longueur ;
 - l'insertion d'un élément ;
 - l'accès à un élement ;
 - la recherche d'un élément à partir de sa clé ;
 - la suppression d'un élément ;
 - la possibilité de _parcourir_ le dictionnaire.

## Un dictionnaire est un tableau constitué de clés et de valeurs

Une clé permet d'accéder à une valeur.


L'accès aux valeurs se fait comme dans une liste : on utilise les crochets, on ne met plus la position de l'élément désiré mais la clé :

In [None]:
d = {1: 'entrée', 1.5: 'plat', 3.14: 'tarte'}
d

In [None]:
d[1.5] # accès à l'élément de clé 1.5

On peut alimenter le dictionnaire avec un nouveau couple `(clé, valeur)` après la création du dictionnaire :

In [None]:
d[0.51] = "apéro"
d

 On remarque que le dictionnaire ne trie pas ses élements selon la clé.

La longueur du dictionnaire est le nombre de couples `(clé, valeur)` qu'il contient.

En Python, on utilise la fonction `len` comme pour les listes : 

In [None]:
len(d)

Pour supprimer une clé (et donc l'accès à une valeur), on utilise l'instruction `del` :

In [None]:
del d[0.51]
d

Pour créer un dictionnaire vide, on utilise : 

In [None]:
mon_dico = {}

## Tous les immutables sont possibles comme clé

Comme par exemple les nombres, les chaînes de caractères :

In [None]:
mon_dico['spé'] = 'NSI'
mon_dico[0] = 'La clé est un nombre.'
mon_dico['0'] = 'La clé est un caractère.'
mon_dico

Un tuple est une clé possible, par exemple le tuple `(3, 1)`.
La liste `[3, 1]` n'est pas possible.

On ne change pas la valeur d'un tuple (normalement), c'est un immutable.
Alors qu'une liste est susceptible de changer, c'est un mutable.

In [None]:
mon_dico[(3, 1)] = "#0f0"
mon_dico

In [None]:
mon_dico[[3,1]] = "#0f0" # produit une erreur

## On peut, comme dans une liste, avoir des valeurs assez complexes

Ci-dessous, la valeur associée à la clé `'repas'` est un tableau contenant en dernier élément un dictionnaire.

In [None]:
d = {}
d['restaurant'] = "Aux Nombreuses Sardines Indigestes"
d['repas'] = ["entree", "plat", {"boisson": "eau plate", "tarif": 0, "volume": 1.5}]
d

On peut récupérer **l'ensemble des clés** avec la méthode `keys` :

In [None]:
d.keys()

On peut voir que l'objet sorti par cette méthode n'est pas une simple liste. Néanmoins cela reste un objet `itérable` (sur lequel on peut boucler) :

In [None]:
for cle in d.keys():
    print(cle)

On peut récupérer **l'ensemble des valeurs** avec la méthode `values`, cela nous donne **l'index** du dictionnaire.

In [None]:
d.values()

**On peut accèder à un élement imbriqué en suivant la logique des accès aux listes et aux dictionnaires**

Cherchons à obtenir `'eau plate'`.

In [None]:
d['repas']

In [None]:
d['repas'][2]

In [None]:
d['repas'][2]['boisson']

*Remarque :* C'est un classique dans le parcours de données au format JSON, format fréquent sur Internet.

On remarque dans l'exemple précédent qu'il a été nécessaire de connaître la position dans la liste. C'est souvent le cas dans les JSON récupérés : il est indispensable d'analyser (et de bien lire la documentation associée) le contenu du JSON avant de pouvoir l'exploiter.

Certains contenus JSON sont néanmoins normalisés comme par exemple les JSON à caractère géographiques (contenant de l'information liée à un positionnement GPS) : les GeoJSON. 

*NB :* La transformation du format JSON en dictionnaire Python est une opération que la bibliothèque Python `json` peut assurer simplement et efficacement.

## Créer un dictionnaire par compréhension

À l'instar de ce que'on peut réaliser avec les listes, on peut créer un dictionnaire **par compréhension**.
La syntaxe est presque la même. On doit évidemment préciser la clé et la valeur.

In [None]:
mon_dico = {f"clé {i}": f"valeur {i}" for i in range(10)}
mon_dico

## Parcours d'un dictionnaire

Dans un _parcours_, il s'agit d'obtenir l'ensemble du contenu du dictionnaire ou du moins de l'ensemble des clés (qui donnent accès au valeurs).

Avec une syntaxe analogue à celle des listes, on parcourt les clés :

In [None]:
for e in mon_dico:
    print(e)

_Remarque :_ Le parcours précédent est analogue à celui vu précédemment avec `for e in mon_dico.keys()`.

On peut aussi parcourir le dictionnaire en obtenant les tuples `(clé, valeur)` :

In [None]:
for e in mon_dico.items():
    print(e)

Avec ce parcours, on peut faire une affectation simultanée de la clé et de la valeur :

In [None]:
for k, v in mon_dico.items():
    print(f"{k} -> {v}")

Python autorise un parcours des valeurs :

In [None]:
for e in mon_dico.values():
    print(e)

*Remarque :*  depuis peu, Python garantit que l'affichage d'un dictionnaire ou son parcours se fait dans l'ordre dans lesquels les clés ont été introduites.

## Problème de la copie

Comme pour les listes, l'utilisation de `deepcopy` du module `copy`
permet de contourner le problème des structures tableaux imbriquées :

In [None]:
d = {'ma_cle': [1, 2, 3]}
e = d
id(e) == id(d)

In [None]:
# on copie pour avoir des id différents
e = d.copy() # on peut aussi copier avec : e = dict(d)
id(e) == id(d)

In [None]:
# mais le tableau imbriquée possède la même adresse !
id(e['ma_cle']) == id(d['ma_cle'])

In [None]:
# la solution : utiliser le module copy
import copy
e = copy.deepcopy(d)

id(e['ma_cle']) == id(d['ma_cle'])

## COMPLEXITÉ

La complexité va dépendre en partie de l'implémentation.

Dans la [doc officielle](https://wiki.python.org/moin/TimeComplexity) du langage Python :

 - insertion : en moyenne O(1), mais en pire cas O(n)
 - accès : en moyenne O(1), mais en pire cas O(n)
 - suppression : en moyenne O(1), mais en pire cas O(n)
 - recherche d'un élément par sa clé (`cle in dico`) : en moyenne O(1), mais en pire cas O(n)
 - parcours : O(n)

## POUR ALLER PLUS LOIN

**Un dictionnaire n'est pas immutable.**

On ne peut donc pas utiliser un dictionnaire comme clé d'un autre dictionnaire :

In [None]:
a = {}
b = {a: 1}

**Comment sont stockées en mémoire ces dictionnaires ?**

L'erreur générée précédemment indique "unhashable type".

Pour chaque clé, un nombre unique est généré, ce nombre permet alors un adressage mémoire à l'image d'un tableau indexé. Pour générer ce nombre unique, on utilise une fonction de hachage : cette fonction prend en entrée un contenu quelconque et produit en sortie un nombre.

Une fonction de hachage assure au moins les 3 propriétés suivantes :
 - les calculs générant le nombre sont rapides ;
 - ils sont déterministes : deux contenus identiques donnent deux nombres identiques ;
 - ils produisent un nombre de longueur fixe.

À partir du nombre, c'est impossible de retrouver le contenu correspondant (ce qui peut amener à d'autres usages de ces fonctions).

**Le nombre est lié à la clé. Donc pour pointer vers la bonne case mémoire quand on demande une valeur, il est important que la clé n'ait pas changée ! Les clés doivent être "hashables" c'est-à-dire en Python immutables ce qui n'est notamment pas le cas des listes et des dictionnaires qui par nature sont susceptibles de changer de contenu au fur et à mesure d'un programme.**

En Python, la fonction `hash` est directement utilisable et fournit une fonction de hachage ; la bibliothèque `hashlib` permet aussi d'utiliser des fonctions de hachage notamment les plus connues. 

In [None]:
import hashlib

# on crée un objet hashlib avec sha256 comme fonction
a = hashlib.sha256()
# on embarque le contenu sous format binaire
a.update(b"NSI")
# on obtient le nombre sous forme hexadécimale
# ce nombre "unique" peut servir pour générer une adresse mémoire
a.hexdigest()

*Pour finir :* Une fois ce nombre généré, Python utilise la fonction modulo pour revenir à des vrais emplacements mémoires. En fait, à la création d'un dictionnaire vide, l'interpréteur Python réserve des emplacements mémoires et quand 2/3 des emplacements réservés sont remplis, il réserve de nouveau d'autres emplacements.

À la suppression d'un élément, il ne libère pas forcément la mémoire, il continue de réserver l'emplacement.


![](table_de_hash.png)

_image issue de [cette vidéo](https://www.youtube.com/watch?v=egTtpqXQz7c)_

**Une fonction est immutable donc peut servir comme clé**

In [None]:
def carree(x): return x ** 2

dico = {carree: "c'est la fonction carrée !"}
dico[carree]

**Mettre à jour un dictionnaire**

On peut certes changer les valeurs une à une dans un dictionnaire, mais on peut aussi utiliser un autre dictionnaire pour mettre à jour les valeurs. À cet effet, Python dispose de la méthode `update` qui permet de mettre à jour les valeurs d'un dictionnaire à partir d'un autre :

In [None]:
options_par_defaut = {"couleur": "#f00", "largeur": 15 , "hauteur": 30, "taille_police": 12}
options_selectionnées_par_un_utilisateur = {"couleur": "#abcdef"}

options_par_defaut.update(options_selectionnées_par_un_utilisateur)
options_par_defaut

Mais cela modifie le dictionnaire par défaut qu'on peut avoir envie de conserver intact...
Une solution serait de "deepcopier" le dictionnaire avant dans un nouveau dictionnaire :

In [None]:
import copy

options_par_defaut = {"couleur": "#f00", "largeur": 15 , "hauteur": 30, "taille_police": 12}
options_selectionnées_par_un_utilisateur = {"couleur": "#abcdef"}

options_finales = copy.deepcopy(options_par_defaut)
options_finales.update(options_selectionnées_par_un_utilisateur)
options_finales

**Attaque par Denial Of Service**

Il existe des cas de **collisions** : des contenus différents qui donnent le même nombre. Python est conçu pour repérer cette situation et fait des calculs supplémentaires pour la résoudre, changeant potentiellement la complexité. Heureusement ces cas sont rares.

Avant la version 3.3 de Python, il était possible d'élaborer une attaque DOS en envoyant, en masse, à l'interpréteur des cas de collisions ce qui bloquait finalement l'ordinateur cible de l'attaque.

## Dans d'autres langages

Les dictionnaires sont très pratiques mais ne sont pas nativement implémentées dans tous les langages.

**en OCamL**

Il n'y a pas à proprement parler de type dictionnaire mais on peut construire des listes de couples : les listes d'associations.

**en Javascript et en C**

Il n'existe pas nativement une telle structure, mais on peut trouver sur Internet des façons de l'implémenter.

**en Lua**

Les tableaux en Lua sont par définition associatifs, donc sont un mix entre listes et dictionnaires. Lua dispose donc de fonctions spéciales pour les parcours.

## Documentation

- [les dictionnaires en Python](https://apcpedagogie.com/les-dictionnaires-en-python/)
- [Python dictionaries](https://www.w3schools.com/python/python_dictionaries.asp)
- [Understanding dictionaries](http://thepythoncorner.com/dev/hash-tables-understanding-dictionaries/)


In [None]:
from IPython.display import IFrame

IFrame('https://www.youtube.com/embed/KyUTuwz_b7Q', 560, 315)

`{'auteur': 'David COBAC', 'licence': 'CC-BY-NC-SA', 'date': 20210810, 'révision': 20210911}`