Dictionnaires
==

Notion de conteneur
--

Les conteneurs sont simplement des objets qui contiennent d'autres objets. On distingue :

Type | Modifiable | Unicité | Relation d'ordre
 ---: | :---: | :---: | :--- 
Liste | Oui | Non | Oui
N-Uplet | Non | Non | Oui
Ensemble | Oui | Oui 1.2 | Non
Frozenset | Non | Oui 2.2 | Non
Dictionnaire | Oui | Clé: Oui, valeurs: Non | Oui depuis Python 3.8

L'ensemble des éléments contenus dans un conteneur sont séparés par des virgules

---

Un dictionnaire est:

* une collection de paires **clé**, **valeurs**
    * chaque **clé** est unique
    * les **valeurs** ne le sont pas forcément
    * la notion de **clé** d'un *dictionnaire* est assimilable à la notion d'*indice* pour une *liste*
* ordonné
    * depuis Python 3.8 (avant, utiliser `collections.OrderedDict`)

**N'importe quel objet *hashable* peut être utilisé en tant que clé.**

Considérations syntaxiques
--

In [None]:
d = {}

Attention, car l'accolade est aussi utilisé pour les ensemble. Pour le dictionnaire, les deux-points sont utilisés pour séparer chaque clé de sa valeur.

In [None]:
dictionnaire = {1: "a", 2: "b"}
ensemble = {1, 2, 3}

les accolades seules désignent un dictionnaire vide. Un équivalent est :

In [None]:
d = dict()

Voici un dictionnaire classique contenant des données:

In [None]:
d = {'clé 1': 'valeur associée à la clé 1', 'clé 2': 'valeur associée à la clé 2'}

Les clés doivent être hashables

In [None]:
{[1, 2]: "valeur"}

In [None]:
{(1, 2): "valeur"}

Convertion de type de données
--

On peut créer un dictionnaire à partir d'un conteneurs de 2-uplets (le premier élément du 2-uplet étant la clé et le second la valeur):

In [None]:
dict([("a", 1), ("b", 2), ("c", 3), ("a", 5)])

In [None]:
dict((("a", 1), ("b", 2), ("c", 3), ("a", 5)))

In [None]:
dict({("a", 1), ("b", 2), ("c", 3), ("a", 5)})

ou plus généralement à partir d'un conteneur qui contient des conteneurs de taille 2

In [None]:
dict((["a", 1], {"b", 2}, ("c", 3), ("a", 5)))

Les clés d'un dictionnaire ne sont pas forcément homogènes, tout comme les valeurs.

In [None]:
d = {1: "a", "b": 2.0, (1, 2): 42, min: []}

Opérateur crochet
--

In [None]:
dictionnaire = {1: "a", 2: "b"}

In [None]:
dictionnaire[1]

In [None]:
dictionnaire[3]

In [None]:
dictionnaire[1:2]

In [None]:
d = {(1, 2): "valeur"}

In [None]:
d[(1, 2)]

In [None]:
d[1, 2]

Méthodes
--

Voici les méthodes du dictionnaire :

In [None]:
d = {'clé 1': 'valeur associée à la clé 1', 'clé 2': 'valeur associée à la clé 2'}
dir(d)

Les méthodes suivantes sont utiles :

* la méthode **get** permet de récupérer une valeur dans un dictionnaire, si elle existe :

In [None]:
print(d.get('clé 1'))

In [None]:
print(d.get('clé 3'))

In [None]:
print(d.get('clé 1', 'valeur par défaut'))

In [None]:
print(d.get('clé 3', 'valeur par défaut'))

In [None]:
'clé 1' in d

In [None]:
'clé 3' in d

* la méthode **pop** permet de renvoyer la valeur associée à la clé passée en paramètre.

In [None]:
d.pop("clé 1")

In [None]:
print(d)

* la méthode **popitem** permet de renvoyer un item, c'est à dire un 2-uplet (clé, valeur) au hasard, comme la méthode pop d'une liste. A noter la différence de sémantique. On dit au hasard, parce que le dictionnaire n'a pas de relation d'ordre et qu'il n'est pas possible de prédire l'ordre de sortie des éléments.

In [None]:
d.popitem()

In [None]:
print(d)

* la méthode **update** permet de mettre à jour un dictionnaire à partir des valeurs du dictionnaire passé en paramètres : les valeurs correspondant aux nouvelles clés sont ajoutées, celles correspondant aux clés déjà existantes sont mises à jour.

In [None]:
d = dict([("a", 1), ("b", 2), ("c", 3), ("a", 5)])
print(d)

In [None]:
d.update({"d": 4, "b": 22})
print(d)

Itérations sur un dictionnaire
--

Les dictionnaires sont particuliers, puisqu'ils sont un conteneurs d'associations entre une clé et une valeur. Ils peuvent ainsi être vus comme un ensemble de 2-uplets.

* la méthode **items** permet de renvoyer ces couples (clé, valeur) ;
* la méthode **keys** permet de renvoyer uniquement les clés ;
* la méthode **values** permet de renvoyer uniquement les valeurs.

L'ensemble de ce que l'on vient de voir permet de manipuler aisément les données et de les représenter de la manière qui sera la plus utile à l'algorithme.

In [None]:
d.items()

In [None]:
d.keys()

In [None]:
d.values()

In [None]:
for k in d.keys():
    print(k)

In [None]:
for v in d.values():
    print(v)

In [None]:
for k, v in d.items():
    print('%s: %s' % (k, v))

Itération ordonnée
--

In [None]:
for k in sorted(d.keys()):
    print('{}: {}'.format(k, d[k]))

In [None]:
import operator
for k, v in sorted(d.items(), key=operator.itemgetter(0), reverse=True):
    print('{}: {}'.format(k, v))

In [None]:
import operator
for k, v in sorted(d.items(), key=operator.itemgetter(1)):
    print('{}: {}'.format(k, v))

In [None]:
help(sorted)

Cas concrets
---------

In [None]:
groupe = [
    {
        "nom": "Satriani",
        "prenom": "Joe",
        "role": "guitariste",
    }, {
        "nom": "Hamm",
        "prenom": "Stuart",
        "role": "bassiste",
    }, {
        "nom": "Campitelli",
        "prenom": "Jeff",
        "role": "batteur",
    }, {
        "nom": "King",
        "prenom": "B.B",
        "role": "guitariste",
    },
]

Cette écriture est plus concrète mais plus verbeuse que :

In [None]:
groupe_list = [["Satriani",
           "Joe",
           "guitariste",],
          ["Hamm",
           "Stuart",
           "bassiste",]]

Dans le premier cas, on a une liste de données bien représentées, dans le second cas, on a une sorte de tableau (liste de listes) où le signifiant n'est pas explicite.

---