**DICTIONNAIRES Terminale : rappels de première**

Un dictionnaire est une _structure de données_ permettant le stockage de données.
C'est un tableau associatif, comme l'est un dictionnaire de langue française ou un index dans un livre dans lesquels on recherche un mot pour obtenir une description ou le numéro d'une page.

Un élément du dictionnaire est un couple `(clé, valeur)`.

L'interface d'un dictionnaire se compose de :
 - sa longueur ;
 - l'insertion d'un élément ;
 - l'accès à un élement ;
 - la recherche d'un élément à partir de sa clé ;
 - la suppression d'un élément ;
 - la possibilité de _parcourir_ le dictionnaire.

**Un dictionnaire est un tableau constitué de clés et de valeurs**

Une clé permet d'accéder à une valeur.


L'accès aux valeurs se fait comme dans une liste : on utilise les crochets, on ne met plus la position de l'élément désiré mais la clé :

In [75]:
d = {1: 'entrée', 1.5: 'plat', 3: 'dessert'}
d

{1: 'entrée', 1.5: 'plat', 3: 'dessert'}

In [76]:
d[1.5] # accès à l'élément de clé 1.5

'plat'

On peut alimenter le dictionnaire avec un nouveau couple `(clé, valeur)` après la création du dictionnaire :

In [77]:
d[0] = "apéro"
d

{1: 'entrée', 1.5: 'plat', 3: 'dessert', 0: 'apéro'}

 On remarque que le dictionnaire ne trie pas le dictionnaire...

La longueur du dictionnaire est le nombre de couples `(clé, valeur)` qu'il contient.

En Python, on utilise la fonction `len` comme pour les listes : 

In [78]:
len(d)

4

Pour supprimer une clé (et donc l'accès à une valeur), on utilise l'instruction `del` :

In [79]:
del d[0]
d

{1: 'entrée', 1.5: 'plat', 3: 'dessert'}

Pour créer un dictionnaire vide, on utilise : 

In [80]:
mon_dico = {}

**Tous les immutables sont possibles comme clé**

Comme par exemple les nombres, les chaînes de caractères :

In [81]:
mon_dico['spé'] = 'NSI'
mon_dico[0] = 'La clé est un nombre.'
mon_dico['0'] = 'La clé est un caractère.'
mon_dico

{'spé': 'NSI', 0: 'La clé est un nombre.', '0': 'La clé est un caractère.'}

Un tuple est une clé possible, par exemple le tuple `(3, 1)`.
La liste `[3, 1]` n'est pas possible.

On ne change pas la valeur d'un tuple (normalement).
Alors qu'une liste est susceptible de changer.

In [82]:
mon_dico[(3, 1)] = "#0f0"
mon_dico

{'spé': 'NSI',
 0: 'La clé est un nombre.',
 '0': 'La clé est un caractère.',
 (3, 1): '#0f0'}

In [83]:
mon_dico[[3,1]] = "#0f0" # produit une erreur

TypeError: unhashable type: 'list'

**On peut, comme dans une liste, avoir des valeurs assez complexes**

Ci-dessous, la valeur est un tableau contenant en dernier élément un dictionnaire.
La nouvelle clé n'est pas numérique.

In [1]:
d = {}
d['restaurant'] = "Aux Nombreuses Sardines Indigestes"
d['repas'] = ["entree", "plat", {"boisson": "eau plate", "tarif": 0, "volume": 1.5}]
d

{'restaurant': 'Aux Nombreuses Sardines Indigestes',
 'repas': ['entree',
  'plat',
  {'boisson': 'eau plate', 'tarif': 0, 'volume': 1.5}]}

On peut récupérer l'ensemble des clés avec la méthode `keys` :

In [2]:
d.keys()

dict_keys(['restaurant', 'repas'])

On peut voir que l'objet sorti n'est pas une simple liste. Néanmoins cela reste un objet `itérable` (sur lequel on peut boucler :

In [3]:
for cle in d.keys():
    print(cle)

restaurant
repas


**On peut accèder à un élement imbriqué en suivant la logique des accès aux listes et aux dictionnaires**

Cherchons à obtenir 'eau plate'.

In [None]:
d['repas']

In [None]:
d['repas'][2]

In [None]:
d['repas'][2]['boisson']

*Remarque :* C'est un classique dans le parcours de données au format JSON, format fréquent sur Internet.

On remarque dans l'exemple précédent qu'il a été nécessaire de connaître la position dans la liste. C'est souvent le cas dans les JSON récupérés : il est indispensable d'analyser (et de bien lire la documentation associée) le contenu du JSON avant de pouvoir l'exploiter.

Certains contenus JSON sont néanmoins normalisés comme par exemple les JSON à caractère géographiques (contenant de l'information liée à un positionnement GPS) : les GeoJSON. 

**Créer un dictionnaire par compréhension**

À l'instar de ce que'on peut réaliser avec les listes, on peut créer un dictionnaire **par compréhension**.
La syntaxe est presque la même. On doit évidemment préciser la clé et la valeur.

In [None]:
mon_dico = {f"clé {i}": f"valeur {i}" for i in range(10)}
mon_dico

**Parcours d'un dictionnaire**

Dans un _parcours_, il s'agit d'obtenir l'ensemble du contenu du dictionnaire ou du moins de l'ensemble des clés (qui donnent accès au valeurs).

Avec une syntaxe analogue à celle des listes, on parcourt les clés :

In [None]:
for e in mon_dico:
    print(e)

on peut aussi parcourir les dictionnaires en obtenant les tuples `(clé, valeur)` :

In [None]:
for e in mon_dico.items():
    print(e)

avec ce parcours, on peut faire une affectation simultanée de la clé et de la valeur :

In [None]:
for k, v in mon_dico.items():
    print(f"{k} -> {v}")

Python autorise un parcours des valeurs :

In [None]:
for e in mon_dico.values():
    print(e)

À savoir : depuis peu, Python garantit que l'affichage d'un dictionnaire ou son parcours se fait dans l'ordre dans lesquels les clés ont été introduites.

**Problème avec la copie**

Comme pour les listes, l'utilisation de `deepcopy` du module `copy`
permet de contourner le problème des structures tableaux imbriquées :

In [None]:
d = {'ma_cle': [1, 2, 3]}
e = d
id(e) == id(d)

In [None]:
# on copie pour avoir des id différents
e = d.copy() # on peut aussi copier avec : e = dict(d)
id(e) == id(d)

In [None]:
# mais le tableau imbriquée possède la même adresse !
id(e['ma_cle']) == id(d['ma_cle'])

In [None]:
# la solution : utiliser le module copy
import copy
e = copy.deepcopy(d)

id(e['ma_cle']) == id(d['ma_cle'])

**COMPLEXITÉ**

La complexité va dépendre en partie de l'implémentation (voir à la fin _Dans d'autres langages_).

Dans la [doc officielle](https://wiki.python.org/moin/TimeComplexity) du langage Python :

 - insertion : en moyenne O(1), mais en pire cas O(n)
 - accès : en moyenne O(1), mais en pire cas O(n)
 - suppression : en moyenne O(1), mais en pire cas O(n)
 - recherche d'un élément par sa clé (`cle in dico`) : en moyenne O(1), mais en pire cas O(n)
 - parcours : O(n)

**POUR ALLER PLUS LOIN**

**Un dictionnaire n'est pas immutable.**

On ne peut donc pas utiliser un dictionnaire comme clé d'un autre dictionnaire :

In [None]:
a = {}
b = {a: 1}

**Comment sont stockées en mémoire ces dictionnaires ?**

L'erreur générée précédemment indique "unhashable type".

Pour chaque clé, un nombre unique est généré, ce nombre permet alors un adressage mémoire à l'image d'un tableau indexé. Pour générer ce nombre unique, on utilise une fonction de hachage : cette fonction prend en entrée un contenu quelconque et produit en sortie un nombre.

Une fonction de hachage assure au moins les 3 propriétés suivantes :
 - les calculs générant le nombre sont rapides ;
 - ils sont déterministes : deux contenus identiques donnent deux nombres identiques ;
 - ils produisent un nombre de longueur fixe.

À partir du nombre, c'est impossible de retrouver le contenu correspondant (ce qui peut amener à d'autres usages de ces fonctions).

Le contenu doit être "hashable" ce qui n'est pas le cas des listes.


En Python, la fonction `hash` est directement utilisable et fournit une fonction de hachage ; la bibliothèque `hashlib` permet aussi d'utiliser des fonctions de hachage notamment les plus connues. 

In [88]:
import hashlib

# on crée un objet hashlib avec sha256 comme fonction
a = hashlib.sha256()
# on embarque le contenu sous format binaire
a.update(b"NSI")
# on obtient le nombre de sortie sous forme hexadécimale
# ce nombre "unique" peut servir pour générer une adresse mémoire
a.hexdigest()

'a0c87b3a9a3f13c4dc2ce2abde4d7dd4a5fb2fd26af757ccfe22cf5ce4840ecf'

À la création d'un dictionnaire vide, l'interpréteur Python réserve des emplacements mémoires et quand 2/3 des emplacements réservés sont remplis, il réserve de nouveau d'autres emplacements.

À la suppression d'un élément, il ne libère pas forcément la mémoire mais continue de réserver l'emplacement.

**Attaque par Denial Of Service**

Il existe des cas de **collisions** : des contenus différents qui donnent le même nombre. Python est conçu pour repérer cette situation et fait des calculs supplémentaires pour la résoudre.

Avant la version 3.3 de Python, il était possible d'élaborer une attaque DOS en envoyant, en masse, à l'interpréteur des cas de collisions ce qui bloquat finalement l'ordinateur cible de l'attaque.

**Comment s'assurer qu'une clé existe sans générer une erreur ?**

Par exemple, on veut créer un nouveau dictionnaire à partir de couples `(clé, valeur)` existant dans un dictionnaire par défaut et d'un dictionnaire des choix fait par l'utilisateur (par exemple avec une interface graphique) :

In [84]:
options_par_defaut = {"couleur": "#f00", "largeur": 15 , "hauteur": 30, "taille_police": 12}
options_selectionnées_utilisateur = {"couleur": "#abcdef"}

options_finales_a_appliquer = {}

for cle in options_par_defaut:
    options_finales_a_appliquer[cle] = options_selectionnées_utilisateur[cle] \
        if options_selectionnées_utilisateur[cle] is not None else options_par_defaut[cle]
    
options_finales_a_appliquer

KeyError: 'largeur'

Le problème réside dans l'évaluation de `options_selectionnées_utilisateur[cle]` sans savoir si le dictionnaire contient cette clé.

On peut donc d'abord tester si le dictionnaire contient la clé :

In [None]:
options_par_defaut = {"couleur": "#f00", "largeur": 15 , "hauteur": 30, "taille_police": 12}
options_selectionnées_utilisateur = {"couleur": "#abcdef"}

options_finales_a_appliquer = {}

for cle in options_par_defaut:
    if cle in options_selectionnées_utilisateur:
        options_finales_a_appliquer[cle] = options_selectionnées_utilisateur[cle]
    else:
        options_finales_a_appliquer[cle] = options_par_defaut[cle]
        
options_finales_a_appliquer

Python dispose de la méthode `update` qui permet de mettre à jour les valeurs d'un dictionnaire à partir d'un autre :

In [None]:
options_par_defaut = {"couleur": "#f00", "largeur": 15 , "hauteur": 30, "taille_police": 12}
options_selectionnées_utilisateur = {"couleur": "#abcdef"}

options_par_defaut.update(options_selectionnées_utilisateur)
options_par_defaut

Mais cela modifie le dictionnaire par défaut... à moins de `deepcopier` le dictionnaire avant.

Néanmoins, Python dispose d'un mécanisme simplifié qui permet de récupérer la valeur dans un dictionnaire si la clé existe et de piocher dans un autre sinon :

In [87]:
options_par_defaut = {"couleur": "#f00", "largeur": 15 , "hauteur": 30, "taille_police": 12}
options_selectionnées_utilisateur = {"couleur": "#abcdef"}

options_finales_a_appliquer = {}

for cle in options_par_defaut:
    options_finales_a_appliquer[cle] = options_selectionnées_utilisateur.get(cle, options_par_defaut[cle])
    
options_finales_a_appliquer

{'couleur': '#abcdef', 'largeur': 15, 'hauteur': 30, 'taille_police': 12}

**Dans d'autres langages**

Les dictionnaires sont très pratiques mais ne sont pas nativement implémentées dans tous les langages.

**en OCamL**

Il n'y a pas à proprement parler de type dictionnaire mais on peut construire des listes de couples : les listes d'associations.

**en Javascript et en C**

Il n'existe pas nativement une telle structure, mais on peut trouver sur Internet des façons de l'implémenter.

**en Lua**

Les tableaux en Lua sont par définition associatifs, donc sont un mix entre listes et dictionnaires. Lua dispose donc de fonctions spéciales pour les parcours.