[Accueil](../../index.ipynb) > [Sommaire Première](../index.ipynb)

# 3.3 Types constuits : les dictionnaires

## Définition générale

<div class="alert alert-info">
    <b>Définition</b>
    En informatique, ces structures de données sont appelées <i>tableau associatif</i> ou <i>table de hachage</i>. Il s'agit d'une <b>collection non ordonnée</b> d’éléments qui permet, à partir d’une <b>clé</b>(unique) d'accéder à une <b>valeur</b> associée.</div>
</div>

## Dans le langage Python

Dans le language Python, la structure la plus ressemblante s'appelle *dictionnaire*.

Comme les listes, les dictionnaires sont **mutables** : on peut modifier leur contenu.

Si on regarde "à l'intérieur" du dictionnaire:
- Les **clés** du dictionnaire doivent être **uniques** et choisies **non mutables** (chaîne de caractères, nombre, tuple).
- Les **valeurs** associées peuvent être d’un type quelconque (liste, dictionnaire, entier, schtroumpf...)

Les listes chaînées (liste ou tuple en python) ne permettent pas d'accéder directement à un élément précis. Il faut parcourir la liste en avançant d'élément en élément jusqu'à trouver celui qu'on recherche. Cela pose des problèmes de performance dès que la liste chaînée devient volumineuse.



In [None]:
%timeit  'x' in range(10)

In [None]:
%timeit 'x' in range(10_000)

In [None]:
%timeit 'x' in range(10_000_000)

Mettons en évidence la linéarité entre le temps nécessaire à l'appartenance de l'élément 'x' à une liste d'entiers (pire des cas) et la longeur de la liste.

In [None]:
import matplotlib.pyplot as plt

quantites = [1000*n for n in range(0, 11)] # je crée la liste [0, 1000, 2000, ... 10000]
results = []
for q in quantites:
    l = [e for e in range(q)] # Je créé la liste de q éléments (de 0 à q-1)
    stats = %timeit -q -o -n 200 'x' in l # je mesure le temps pour trouver 'x' n'appartient dans la liste
    results.append(stats.average)

plt.figure(figsize=(10,6))
plt.ylim(top=max(results))
plt.scatter(quantites,results)
plt.grid(which='both')
plt.title("Temps d'execution moyen d'appartenance à 'x' à une liste de n entiers")
plt.xlabel('nombre d\éléments dans la liste')
plt.ylabel('temps en s')
plt.show()

## Implémentation en Python

### Création d'un dictionnaire

- Pour créer un dictionnaire on utilise un couple d'accolades {}
- Les éléments du dictionnaire sont séparés par des virgules
- le couple clé/valeur est séparé par ':'

**Exemple :**

In [None]:
dico = {'nom':'Gérard', 'age':75, 'commentaire':'un lascar', 'enfants':['Maurice','Corinne']}
# J'ai un dictionnaire dont les clés sont : 'nom', 'age', 'commentaire' et 'enfants'
# La valeur de la clé 'age' est le nombre 75
# la valeur de la clé 'enfants' est une liste
dico

**Exemple2 :**

Un dictionnaire est **mutable**, on peut donc le modifier en le **peuplant** de clés/valeurs:

In [None]:
dico2 = {}  # Je crée un dictionnaire vide
dico2['nom'] = 'Brandin' # J'ajoute la clé/valeur nom:Brandin
dico2['age'] = 25
dico2['commentaire'] = 'un sacré bout en train'
dico2['enfants'] = ['Kevin', 'Sandy']
dico2

Et je peux **modifier** la valeur associée à une clef.

In [None]:
dico2['nom'] = 'Brandon'
dico2['nom']

**Exemple 3 :**

Il est également possible de créer un dictionnaire par **compréhension**.

In [None]:
# voici une liste de tuples
l = [('nom', 'Barnabé'), ('age', 27), ('enfants', ['Gaston', 'Louise'])]
# créons un dictionnaire dont les clés sont les premiers éléments des tuples et les valeurs les deuxièmes.
dico3 = {k:v for k,v in l}
dico3

### Accès à une donnée par clé

l'accès à une valeur s'effectue en spécifiant la clé:

In [None]:
dico2['age']

On peut également utiliser *get(key, [default])* qui retourne la valeur associée à *key* si celle ci est présente. Une valeur par défaut optionnelle est retournée si la clé est absente.

In [None]:
dico2.get('commentaire')

In [None]:
dico2.get('commentaire', 'Le commentaire par défaut si absent')

In [None]:
dico2.get('pere', 'Non précisé')

### Accès aux clefs/valeurs

Il est possible d'obtenir toutes les clés d'un dictionnaire, ainsi que toutes ces valeurs.

In [None]:
dico2.keys()

In [None]:
dico2.values()

<div class="alert alert-warning">

Depuis la version 3.7 de Python les dictionnaires sont **ordonnés** (une table de hashage ne l'est pas). Ainsi l'appel de la fonction keys() retourne toujours les clés dans le même ordre.

</div>

### Itération sur un dictionnaire

Un dictionnaire est **itérable**. Voici le comportement.

In [None]:
for k in dico2:
    print(k)
    
# ceci est equivalent à:

# for k in dico2.keys():
#     print(k)

### Attention aux affectations

<div class="alert alert-danger">
   Attention, ayez bien à l'esprit le comportement suivant lorsque vous écrivez du Python: 
    
</div>

In [None]:
personne1 = {'nom' : 'Poutine', 'prenom' : 'Vladimir'}
personne2 = personne1 # J'affecte la variable personne1 dans personne2

personne1['prenom'] = 'Vladimort' # Je modifie la personne 1
personne1

In [None]:
personne2

En modifiant *personne1*, j'ai également modifié *personne2*. Ces deux variables **pointent** vers la même référence en mémoire.

Et il en est de même pour les **listes**.

In [None]:
l1 = [1, 2, 3]
l2 = l1
l1.append(4)
print(f"l1 pointe sur l'adresse mémoire {id(l1)}")
print(f"l2 pointe sur l'adresse mémoire {id(l2)}")
print(f"l1 = {l1} et l2 = {l2}")

Le comportement est **différent** pour les **chaines de caractères**.

In [None]:
mot1 = 'Bonjour'
mot2 = mot1
print(f"mot1 pointe sur l'adresse mémoire {id(mot1)}")
print(f"mot2 pointe sur l'adresse mémoire {id(mot2)}")

mot1 += 'r'
mot2
print(f"mot1 pointe sur l'adresse mémoire {id(mot1)}")
print(f"mot2 pointe sur l'adresse mémoire {id(mot2)}")

print(f"Maintenant mot1 vaut '{mot1}' alors que mot2 vaut '{mot2}'.")

Si vous voulez **copier** un dictionnaire, il faut utiliser la fonction **copy**.

In [None]:
personne1 = {'nom' : 'Poutine', 'prenom' : 'Vladimir'}
personne2 = personne1.copy() # J'affecte une copie de la variable personne1 dans personne2

print(f"id(personne1) : {id(personne1)}")
print(f"id(personne2) : {id(personne2)}")

personne1['prenom'] = 'Vladimort'
personne2 # personne2, n'aura pas été affecté par la modification de personne1

### Suppression de clé/valeur

si on désire supprimer une clé, on utilise la commande *del*.

In [None]:
del(dico2['commentaire'])
dico2

## Dictionnaires imbriqués

Un dictionnaire peut contenir d'autres dictionnaires (comme une liste peut contenir des listes)

Voici un exemple:

In [None]:
gerard = {'prénom':'Gérard', 'âge':47}
marceline = {'prénom':'Marceline', 'âge':45}
kevin = {'prénom':'Kévin', 'âge':17}

# Je crée un dictionnaire de dictionnaires

famille = {'père':gerard, 'mère':marceline, 'fils':kevin}

In [None]:
# On peut accèder aux données avec une double itération:

for membre in famille:
    print(membre)
    for attribut in famille[membre]:
        print(f"  {attribut} : {famille[membre][attribut]}")

## Temps d'accès en fonction de la taille du dictionnaire.

In [None]:
import matplotlib.pyplot as plt

quantites = [1000*n for n in range(0, 11)] # je crée la liste [0, 1000, 2000, ... 10000]
results = []
for q in quantites:
    d = {q:0 for q in range(q)} # Je crée un dictionnaire de q clés, ayant toutes la valeur 0
    stats = %timeit -q -o -n 100000 d.get(-1, 'rien') # le dictionnaire n'a pas la clé -1
    results.append(stats.average)

plt.figure(figsize=(10,6))
plt.ylim(top=max(results))
plt.scatter(quantites,results)
plt.grid(which='both')
plt.title("Temps d'execution moyen de la recherche d'une clé absente d'un dictionnaire de n clés")
plt.xlabel('nombre de clés dans le dictionnaire')
plt.ylabel('temps en s')
plt.show()

Contrairement aux listes, on constate que le temps de recherche d'une clé non présente dans le dictionnaire est **indépendante** de la taille du dictionnaire.

[Accueil](../../index.ipynb) > [Sommaire Première](../index.ipynb)