# TD : Tables de hachage

## Exercice 1 : Opérations de base dans une 1ère table de hachage 

On utilise comme table de hachage un tableau de 10 cases où la case d'indice `i` contient l'ensemble des nombres terminant par le chiffre `i`.

### Question 1  :  La recherche

- Définir une fonction `rechercher` qui prend en paramètre une table de hachage et un entier et renvoie `True` si l'entier est dans la table, et `False` sinon. 

In [1]:
def rechercher(table, entier):
    indice = entier % 10
    return entier in table[indice]

### Question 2 : L'ajout  

- Définir une fonction `ajouter` qui prend en paramètre une table de hachage et un entier et ajoute cet entier dans la table s'il n'existe pas. 

In [2]:
def ajouter(table, entier):
    indice = entier % 10
    if entier not in table[indice]:
        table[indice].add(entier)

### Question  3  : La suppression

- Définir une fonction `supprimer` qui prend en paramètre une table de hachage et un entier et supprime cet entier dans la table s'il est présent.

**Remarque :** On utilisera la fonction `L.pop()` qui supprime le dernier élément de la table `L`.

In [3]:
def supprimer(table, entier):
    indice = entier % 10
    if entier in table[indice]:
        table[indice].remove(entier)

## Exercice 2 : Opérations de base dans une 2ème table de hachage 

### Question 1 : La recherche 

- Définir une fonction `rechercher2` qui prend en paramètre une table de hachage et une valeur et renvoie `True` si la valeur est dans la table, et `False` sinon. On ne fait pas d'hypothèse sur le nombre de cases de la table. La fonction de hachage est celle définie en cours.

**Remarque :** Si la valeur que l'on veut stocker dans la table est entière, il suffit de transformer l'entier en une chaîne de caractères avec `str(entier)`.

In [4]:
def hachage(chaine):
    nombre = 0
    i = 0
    while i < len(chaine):
        nombre += ord(chaine[i])
        i += 1
    return nombre

def rechercher2(table, valeur):
    cle = hachage(str(valeur)) % len(table)
    return valeur in table[cle]

### Question 2 : L'ajout 

- Définir une fonction `ajouter2` qui prend en paramètre une table de hachage et une valeur et ajoute cette valeur dans la table si elle n'existe pas.  On ne fait pas d'hypothèse sur le nombre de cases de la table. La fonction de hachage est celle définie en cours.

In [5]:
def ajouter2(table, valeur):
    cle = hachage(str(valeur)) % len(table)
    if valeur not in table[cle]:
        table[cle].append(valeur)

### Question 3 : La suppression  
- Définir une fonction `supprimer2` qui prend en paramètre une table de hachage et un entier et supprime cet entier dans la table s'il existe. 

On ne fait pas d'hypothèse sur le nombre de cases de la table. La fonction de hachage est celle définie en cours.

**Remarque :** on utilisera la fonction `L.pop()` qui supprime le dernier élément de la table `L`.

In [6]:
def supprimer2(table, entier):
    cle = hachage(str(entier)) % len(table)
    if entier in table[cle]:
        table[cle].remove(entier)

## Exercice 3 : Hachage fermé (ou à adressage ouvert)


Dans cet exercice, on suppose que l'on stocke dans les cases de la table de hachage des valeurs et non des tableaux de valeurs (on peut donc mettre au plus une valeur dans chaque case de la table). Il faut alors une méthode pour gérer les *collisions* (cas où plusieurs éléments à stocker ont la même valeur de hachage).

Lorque l'on essaie d'insérer un nouvel est élément et que la case où on veut le mettre est déjà occupée, il faut essayer de le placer dans une autre case, et ainsi de suite jusqu'à en trouver une libre. On dit alors que l'on *sonde* la table pour trouver une case libre. Dans ces conditions, la fonction de hachage prend un argument supplémentaire qui compte le nombre de tentatives infructueuses pour trouver une case libre.

### Question 1 : Sondage linéaire 

Dans le cas du *sondage linéaire*, on avance dans le tableau d'un nombre fixe de cases (souvent une case) à chaque fois jusqu'à trouver une case vide. Si le pas est un, la fonction de hachage s'écrit $h(k,i)= h_1(k)+i$ où $h_1$ est un fonction de hachage simple et $i$ est le nombre de tentatives pour trouver une case vide.

- Éxécuter à la main l'algorithme d'insertion dans une table de taille `m=9` des  valeurs 5, 28, 19, 15, 20, 33, 12, 17 en utilsant la fonction $h_1(k)=k \mod 9$.
- Écrire les fonctions permettant d'insérer et de rechercher une valeur dans une table de hachage de taille `m` avec la fonction de hachage à sondage linéaire qui vient d'être décrite. 
- Que se passe-t-il si l'on supprime des valeurs dans la table ? Comment peut-on résoudre ce problème ?

**Réponse :** 

`Indice` : 0  1  2  3  4  5  6  7  8
              
 `Valeur` : . 28 19 20 12  5 15 33 17





In [7]:
def h1(k, m):
    return k % m

def inserer(table, valeur):
    m = len(table)
    for i in range(m):
        index = (h1(valeur, m) + i) % m
        if table[index] is None:
            table[index] = valeur
            return True
    return False

def rechercher(table, valeur):
    m = len(table)
    for i in range(m):
        index = (h1(valeur, m) + i) % m
        if table[index] is None:
            return False
        if table[index] == valeur:
            return True
    return False

**Réponse :** Si on remplace une valeur par `None`, cela casse la chaîne de sondage, et une recherche peut s’arrêter trop tôt, pensant que la valeur n’est pas là.




### Question 2 : Double hachage

Le sondage linéaire présente un gros inconvénient. Même si la fonction de hachage répartit les clés uniformément dans la table, la résolution des collisions a tendance à former des "paquets" de valeurs ce qui conduit à rapidement augmenter le nombre de recherches infructueuses.

Une solution pour résoudre le problème des "paquets" est de modifier la méthode de sondage pour que les cases sondées soient éloignées de manière variable. Le double hachage est l'une des meilleurs méthodes connues pour cela. Il utilise une fonction de hachage de la forme $h(k,i)=h_1(k)+ih_2(k) \mod m$ où $h_1$  et $h_2$ sont des  fonctions de hachage auxiliaires simples.

- Insérer les valeurs de la Question 1 dans une table de taille $m=13$ en utilisant un double hachage où $h_1(k)= k \mod 13$ et $h_2(k)=1+ (k \mod 12).$ 
- Que se passe-t-il si $h_2(k)$ et $m$ ne sont pas premiers entre eux ? En quoi est-ce gênant ?  Comment y remédier ? 

**Réponse :** 

`Indice` : 0   1   2   3   4   5   6   7   8   9   10  11  12

`Valeur` : .   .  28  17  33   5  19  20  .   .   15   .  12



Si `h₂(k)` et `m` ne sont pas premiers entre eux, la fonction de hachage ne peut pas explorer toutes les cases de la table : certaines positions deviennent inaccessibles. Résultat : on peut croire que la table est pleine alors qu’il reste de la place → échec de l'insertion.