# ITC2 - MP/PSI
---

# TP2 : Tables de hachage
 
Il s'agit dans ce TP de constater expérimentalement l'efficacité des
tables de hachage pour stocker des ensembles (d'entiers pour
simplifier).

# Gestion des collisions par sondage

Nous nous intéressons à la gestion des collisions par sondage et nous
voulons comparer expérimentalement les longueurs des séquences de sondage en fonction de la fonction de sondage associée. 

## Exercice 1 : Une fonction de hachage

Dans ce TP, on utilisera toujours la même fonction de hachage `hachage` qui prend en argument un élément et la longueur de la table de hachage et renvoie l'élément modulo le nombre d'alvéoles de la table de hachage. Écrire le code de cette fonction.

In [None]:
assert(hachage(4323, 34) == 5)

## Exercice 2 : Fonctions de sondage
Toutes les fonctions ici prendrons trois entiers en argument : l'indice de l'alvéole initialement prévue, l'indice de l'alvéole considérée, et le nombre total d'alvéole.

1. On veut que le sondage donne la case suivante par rapport à l'alvéole considérée, en revenant au début de la table de hachage si nécessaire. Écrire une fonction `sondage1` correspondante.

2. On veut que le sondage fasse un saut de 17 cases (en revenant au début de la table de hachage si nécessaire) à chaque fois. Écrire la fonction `sondage2` correspondante.

3. Notons $N$ le nombre d'alvéoles. On veut associer à chaque entier une permutation des entiers $\{ 0, \dots, N-1\}$ qui est un cycle. Pour ce faire, on va créer une liste contenant ces cycles et associer à l'entier $i$ le cycle de la case $i$ modulo $N$. La fonction `cycle` ci-dessous fournit une liste de cycles.

In [None]:
import itertools

def traduction(C, N):
    P = [ -1 ] * N
    P[0] = C[0]
    for i in range(len(C) - 1):
        P[C[i]] = C[i+1]
    P[C[-1]] = 0
    return P

import random

def cycles(N, i):
    """Renvoie la séquence de sondage associée à i si la table de hachage possède N alvéoles"""
    random.seed(17)
    les_cycles = []
    for _ in range(1000):
        liste = random.sample(list(range(1, N)), N-1)
        les_cycles.append(traduction(liste, N))
    return les_cycles[i%1000]

Écrire une fonction `sondage3` qui permet d'utiliser la séquence de sondage $i, \sigma_i(i), \sigma_i\circ \sigma_i(i), \dots, \sigma_i\circ \dots\circ\sigma_i(i),\dots$ pour une entrée dont la valeur hachée est $i$.

## Exercice 3 : Créer une table de hachage vide

Écrire une fonction `nouvelle_table_hachage` qui prend en argument un entier et crée une table de hachage ayant ce nombre d'alvéole et dont chaque alvéole contient `None`.

In [None]:
H = nouvelle_table_hachage(128)
assert(len(H)==128 and H[17]==None)

## Interlude : Une fonction comme paramètre d'une autre fonction

En python, on peut donner une fonction comme paramètre à une autre fonction.

Exemple :

In [None]:
import math

def affichage(f, x):
    print('La valeur de la fonction en la variable est :')
    print(f(x))
    
affichage(math.cos, 0)

## Exercice 4 : Ajouter un élément

Écrire une fonction `ajout` qui prend en argument une table de hachage, un entier à ajouter dans la table, une fonction supposée être une fonction de hachage et une fonction supposée être une fonction de sondage (sans rien vérifier dessus) et ajoute l'entier dans la table de hachage, en utilisant une gestion des collisions par sondage selon la fonction fournie. La fonction `ajout` doit renvoyer le nombre d'alvéoles visitées avant d'avoir pu ajouter un élément dans la table (si on ajoute dans l'alvéole d'indice la valeur hachée, alors elle renvoie 1). N'oubliez pas qu'un entier ne peut pas apparaître deux fois dans la table puisqu'il s'agit ici d'encoder un ensemble. Pour simplifier, on suppose qu'on est sûr qu'il reste de la place dans la table de hachage.

In [None]:
H = nouvelle_table_hachage(128)
n1 = ajout(H, 145, hachage, sondage1)
n2 = ajout(H, 145, hachage, sondage1)
n3 = ajout(H, 17, hachage, sondage1)
assert(H[0] == None and H[17] == 145 and H[18] == 17)
assert(n1 == 1)
assert(n2 == 1)
assert(n3 == 2)

In [None]:
H = nouvelle_table_hachage(128)
n1 = ajout(H, 145, hachage, sondage2)
n2 = ajout(H, 145, hachage, sondage2)
n3 = ajout(H, 17, hachage, sondage2)
assert(H[0] == None and H[17] == 145 and H[34] == 17)
assert(n1 == 1)
assert(n2 == 1)
assert(n3 == 2)

In [None]:
H = nouvelle_table_hachage(128)
n1 = ajout(H, 17, hachage, sondage3)
n2 = ajout(H, 17+128, hachage, sondage3)
n3 = ajout(H, 17+7*128, hachage, sondage3)
assert(H[0] == None and H[17] == 17 and H[111] == 913)
assert(n1 == 1)
assert(n2 == 2)
assert(n3 == 3)

## Exercice 4 : Statistiques de répartition

On a dit que le temps d'accès à un élément dans une table de hachage dont les collisions sont gérées par sondage dépend essentiellement de la longueur de la séquence de sondage à suivre.

On va donc ici faire des statistiques sur le nombre de sondages à faire pour insérer un élément.

Écrire une fonction `remplir` qui prend en argument un entier `N` une fonction de sondage et :

* crée une nouvelle table de hachage de taille `N`
* ajoute les entiers 0 à `N-1` à la table dans un ordre aléatoire (utiliser `random.sample`), en utilisant la fonction `hachage` et la fonction de sondage fournie en argument
* renvoie le nombre moyen de sondages effectués

Comparons maintenant le nombre moyen de sondages effectués (à noter que l'exécution pour `sondage3` est plus lente parce que la fonction est générique et pas du tout optimisée pour ce type de sondage) :

In [None]:
remplir(128, sondage1)

In [None]:
remplir(128, sondage2)

In [None]:
remplir(128, sondage3)