# Les dictionnaires

## Présentation

Le terme est plutôt explicite : un objet de type `dict` en Python se conçoit comme un dictionnaire de la vie réelle : à chaque entrée correspond une information. L’entrée est appelée **clé** (*key*), quand l’information est appelée **valeur** (*value*).

Une différence notable toutefois : lorsque le dictionnaire que l’on feuillette est ordonné, le dictionnaire en Python ne l’est absolument pas. En fait, c’est intuile. Python n’a aucunement besoin de connaître l’ordre des clés pour retrouver rapidement les valeurs associées, alors que pour nous autres humains, eh bien, ce serait compliqué de se repérer dans un dictionnaire tout mélangé !

Et disons-le tout de suite : le dictionnaire est un objet mutable, donc modifiable après sa création.

D’un point de vue informatique, un dictionnaire est une table de hachage. Et une table de hachage, c’est hachement bien :  
[https://fr.wikipedia.org/wiki/Table_de_hachage](https://fr.wikipedia.org/wiki/Table_de_hachage)

Pour s’en convaincre rapidement, un cas pratique :

In [None]:
# A list of lists of lists
houses = [
    ['House Lannister', ['Jaime', 'Cersei', 'Tywin', 'Tyrion']],
    ['House Stark', ['Sansa', 'Arya', 'Jon Snow', 'Eddard']]
]

Comment lister les membres de la maison Stark ?

### Point de vue de l’agent humain

Pour un être humain, c’est dans ce cas assez facile : la liste est courte. On sait repérer qu’il s’agit de la deuxième entrée, donc en position 1 dans la liste.

On parvient à une sous-liste, qui contient le nom de la maison en position 0, puis la liste des membres en position 1.

In [None]:
for character in houses[1][1]:
    print(character)

Et si la liste comportait une centaine d’entrées ? 1000 ? 10 000 ?

### Point de vue de la machine

Pour la machine, c’est un peu plus compliqué. Elle ne repère pas d’un coup d’œil la conformité entre l’information en position 1 et la recherche voulue par la procédure. Elle a donc besoin de parcourir la liste du début jusqu’à tomber sur la bonne entrée :

In [None]:
for house in houses:
    if house[0] == 'House Stark':
        for character in house[1]:
            print(character)

### Création d’un dictionnaire

Un dictionnaire peut se créer avec la fonction `dict()`, tout comme in extenso avec des `{}`. À chaque clé est associée une valeur grâce à la syntaxe `:` et les entrées sont séparées les unes des autres par des virgules.

In [None]:
# A directory of the main houses in GoT
houses = {
    'House Lannister': ['Jaime', 'Cersei', 'Tywin', 'Tyrion'],
    'House Stark': ['Sansa', 'Arya', 'Jon Snow', 'Eddard']
}

Et maintenant, comment lister les membres de la maison Stark ?

In [None]:
# Pretty! Simple! Efficient!
for character in houses['House Stark']:
    print(character)

Et pour trouver cette information, Python n’a même pas eu à parcourir le dictionnaire.

Puisqu’on vous dit que c’est hachement bien une table de hachage !

## Manipuler un dictionnaire

### Le point sur la fonction `dict()`

Pour créer un dictionnaire avec `dict()`, la fonction exige en paramètre une liste de tuples dont la première entrée sera la clé et la seconde la valeur :

In [None]:
houses = dict([
    ('House Lannister', ['Jaime', 'Cersei', 'Tywin', 'Tyrion']),
    ('House Stark', ['Sansa', 'Arya', 'Jon Snow', 'Eddard'])
])

Il existe une autre variante d’écriture, qui requiert un peu de doigté :

In [None]:
houses = dict(
    lannister = ['Jaime', 'Cersei', 'Tywin', 'Tyrion'],
    stark = ['Sansa', 'Arya', 'Jon Snow', 'Eddard']
)

Cette méthode passe par des *kwargs*, des *keyword arguments*. Dans notre situation, elle n’est pas envisageable car on perd la finesse de détails de la clé (présence du caractère espace), mais lorsque les clés d’un dictionnaire sont constituées d’identifiants formatés, elle se révèle pratique.

### Accéder aux valeurs

Deux manières :
- avec `[]` (identique aux listes)
- avec la méthode `get()`

In [None]:
print(houses['lannister'])
print(houses.get('stark'))

La subtilité : si une clé n’existe pas, la méthode `get()` renvoie `None` ou un second argument au lieu de lever une exception.

In [None]:
# Key 'targaryen' doesn't exist, the second parameter is returned
print(houses.get('targaryen', 'Cette maison n’existe pas encore.'))

### Ajouter/modifier/supprimer des entrées

L’objet `dict` étant mutable, on peut le modifier après sa création :

In [None]:
# A new entry
houses['targaryen'] = ['Daenerys', 'Rhaegar', 'Rhaella', 'Aerys']

In [None]:
# A new member in the House Stark
houses['stark'].append('Lyanna')

In [None]:
# Deletes a whole entry
del houses['lannister']

Un autre dictionnaire peut servir à compléter un dictionnaire existant, grâce à la méthode `update()` :

In [None]:
houses.update({
    'House Bolton': ['Roose', 'Ramsey', 'Walda']
})

## Techniques courantes

### Calculer le nombre d’entrées

Aucun mystère, la fonction `len()` répond au besoin :

In [None]:
len(houses)

### Test d’appartenance

Comment vérifier qu’une clé est présente dans un dictionnaire ?

In [None]:
'House Stark' in houses

### Parcourir toutes les entrées

Tâche facilement réalisable avec une boucle `for` :

In [None]:
for house in houses:
    print(house)

Le résultat est la liste des clés, mais pas celle des valeurs associées. Il est alors préférable d’utiliser la méthode `items()` :

In [None]:
for house in houses.items():
    print(house)

Comme le résultat est un tuple, ne pas hésiter à désempiler les items :

In [None]:
for house, members in houses.items():
    print(f"{house} est composée de : {', '.join(members)}")

À noter deux autres méthodes :
- `keys()` pour se limiter aux clés
- `values()` pour se limiter aux valeurs

In [None]:
names = houses.keys()
members = houses.values()

### Un dictionnaire ordonné

Le type natif `dict` renvoie un objet non ordonné qui, en prime, ne conserve pas l’ordre d’insertion des items. Comme nous l’avons vu, du point de vue de la machine, cela n’a aucune importance. Si l’ordre est pour vous important, il faut faire appel au type dérivé `orderedDict` du module `collections`.

In [None]:
from collections import OrderedDict

ordered_dict_words = OrderedDict()

sentence = [
    ("We", "PNP", "we"),
    ("are", "VBB", "be"),
    ("the", "AT0", "the"),
    ("knights", "NN2", "knight"),
    ("who", "PNQ", "who"),
    ("say", "VBB", "say"),
    ("Ni", "NP0", "ni"),
    ("!", "SENT", "!"),
]

Et maintenant, pour remplir le dictionnaire en respectant l’ordre d’insertion :

In [None]:
for word, tag, lemme in sentence:
    ordered_dict_words[word] = [tag, lemme]
print(ordered_dict_words)

Vous pouvez facilement vérifier que la situation serait différente avec un dictionnaire natif :

In [None]:
unordered_dict_words = dict()
for word, tag, lemme in sentence:
    unordered_dict_words[word] = [tag, lemme]
print(unordered_dict_words)

**Quoi ?!** Le résultat est le même !

En fait, depuis la version Python 3.6, l’algorithme de création des dictionnaires peut donner l’impression que l’ordre est respecté. Rien toutefois ne le garantit, il ne faut pas s’y fier !

### Regrouper des entrées

Pour continuer sur l’exemple tiré de la série *Game Of Thrones*, imaginons que vous disposiez au départ d’une liste de tuples avec, pour chaque personnage, la maison à laquelle il appartient :

In [None]:
houses = [
    ('House Lannister', 'Jaime'),
    ('House Stark', 'Arya'),
    ('House Targaryen', 'Daenerys'),
    ('House Targaryen', 'Rhaegar'),
    ('House Lannister', 'Cersei')
]

Vous souhaitez désormais créer, comme plus haut, une structure de données qui prendrait la forme d’un dictionnaire devant gérer des listes. Chaque clé serait le nom d’une maison et la valeur associée en serait une liste de noms.

Il s’agit d’un problème très classique, qui se règle avec un type `dict` :

In [None]:
houses_dict = dict()

for house, characters in houses:
    if house not in houses_dict:
        houses_dict[house] = []
    houses_dict[house].append(characters)

print(houses_dict)

Moins acrobatique, la solution qui recourt au type dérivé `defaultdict` a aussi le mérite d’être plus explicite :

In [None]:
from collections import defaultdict

# Specifying values will be 'list'
# we save two steps in the algorithm
houses_dict = defaultdict(list)

for house, characters in houses:
    houses_dict[house].append(characters)

print(houses_dict)

### Tri multicritères

Là encore, il s’agit d’un problème récurrent qui se résoud de deux manières. La première fait appel aux fonctions anonymes, appelées `lambda`, et la seconde à un module `operator`.

Reprenons l’exemple des maisons de la série *Game of Thrones* :

In [None]:
# A list of houses
houses = {
    'House Lannister': ['Jaime', 'Cersei', 'Tywin', 'Tyrion'],
    'House Stark': ['Sansa', 'Arya', 'Jon Snow', 'Eddard'],
    'House Targaryen': ['Daenerys', 'Rhaegar', 'Rhaella', 'Aerys'],
    'House Bolton': ['Roose', 'Ramsey', 'Walda']
}

Si l’objectif est de trier simplement par la clé :

In [None]:
# Sorting the dict by name of houses
sorted(houses.items())

Et pour effectuer un tri inverse :

In [None]:
# Reverse sorting
sorted(houses.items(), reverse=True)

Un peu plus compliqué : on voudrait trier selon le premier membre de chaque maison. Dans ce cas précis, *House Targaryen* arriverait en premier (Daenerys), puis *House Lannister* (Jaime)…

On atteint l’objectif en passant une fonction `lambda` au paramètre `key` de la fonction `sorted()` :

In [None]:
# Sorting houses by its first member
sorted(houses.items(), key=lambda x: x[1])

Comment cela fonctionne ? La syntaxe d’une fonction anonyme est excessivement simple :
```python
lambda argument: expression
```
Appliquons à la fonction carré :

In [None]:
square = lambda x: x ** 2
print(square(4))

Pour aller encore plus loin, on va résoudre le cas où nous voudrions d’abord trier le dictionnaire par nom de maison, puis trier les membres de chaque maison par ordre alphabétique.

La solution est en fait bien plus simple que l’énoncé de la question nous le ferait penser :

In [None]:
# Sorting houses by their name then
# sorting their members alphabetically
for house, characters in sorted(houses.items()):
    print(f"{house}: {sorted(characters)}")

Pour les réfractaires des fonctions anonymes, Python implémente des méthodes utilitaires à l’intérieur du module `operator`.

Dans l’exemple ci-dessous, la méthode `itemgetter()` va sélectionner comme clé de tri l’un des items de l’objet transmis (la liste des membres d’une maison) :

In [None]:
import operator

sorted(houses.items(), key=operator.itemgetter(1))