# Serie 10
Ce document contient les différents exercices à réaliser. Veuillez compléter et rendre ces exercices pour la semaine prochaine.

Pour chaque exercice:
* implémentez ce qui est demandé
* commentez votre code
* expliquez **en français or English** ce que vous avez codé dans la cellule correspondante

Dans vos explications à chacun des exercices, indiquez un pourcentage subjectif d'investissement de chaque membre du groupe. **Des interrogations aléatoires en classe pourront être réalisées pour vérifier votre contribution/compréhension**.

Les tentatives infructueuses, les explications, commentaires et analyses des échecs **rapportent des points**. Ne rendez pas copie-blanche, même si votre fonction n'est pas correcte.

## Exercice 1
Implémentez une type de données abstrait `HashTable` (table de hachage) qui utilise une dispersion linéaire (linear probing strategy) pour résoudre les collisions. La classe `HashTable` et ses fonctions à implémenter sont données - libre à vous cependant d'ajouter de nouvelles méthodes aux aux classes. Vous pouvez optionnellement utiliser une dispersion quadratique.

Vous devez implémenter une classe `HashableImpl` dont les fonctions sont données. Cela correspond aux éléments qui seront stockés dans la hash table.

In [1]:
# Représente un élément pouvant être stocké dans une instance de HashTable.
class HashableImpl:
    key = None
    is_active = True
    def __init__(self, key, is_active=True):
        self.key = key
        self.is_active = is_active  # (useless for you but keep it)

    # Calcule le hash de cette instance de HashableImpl.
    # La valeur retournée est un hash, représenté par un nombre entier.
    def hash(self, table_size):
       
        return self.key % table_size

    # Retourne la clé comme représentation de cette instance
    # (vous n'avez pas besoin de modifier cette fonction).
    def __str__(self):
        return str(self.key)


class HashTable:
    def __init__(self):
        self.ht = [] # Initialise la liste utilisée pour stocker les éléments de la hashtable
        self.size = 0 # Compte le nombre de clés présentes dans la table
        self.collisions = 0 # Compte le nombre de collisions
         

    # Indique le nombre de collisions qui ont eu lieu lors de la recherche d'éléments dans la hashtable
    def number_of_collisions(self):
        return self.collisions

    # Vide la hashtable et réinitialise le compteur de collisions
    def make_empty(self):
        self.ht = []
        self.size = 0
        self.collisions = 0

    # Vérifie si la hashtable est vide ou pas.
    # Retourne True si la hashtable est vide, False sinon
    def is_empty(self):
        return self.size == 0 # Return True if the size is 0 simple as that

    # Insére un élément x HashableImpl dans la hash table.
    def insert(self, x):
        index = x.hash(len(self.ht) or 1) #Handle empty list on first insert
        if len(self.ht) == 0:
            self.ht = [None] * 11
            
        while self.ht[index] is not None:
            index = (index + 1) % len(self.ht)
            self.collisions += 1
        self.ht[index] = x
        self.size += 1
        
    # Supprime l'élément x HashableImpl de la hash table
    # Une exception ItemNotFound est levée si l'élément ne se trouve pas dans la liste
    def remove(self, x): # Throws ItemNotFound
        index = x.hash(len(self.ht))
        while self.ht[index] is not None:
            if self.ht[index].key == x.key:
                self.ht[index].is_active = False
                self.size -= 1
                return
            index = (index + 1) % len(self.ht)
        raise ItemNotFound

    # Trouve l'élément x HashableImpl dans hash table
    # Une exception ItemNotFound est levée si l'élément ne se trouve pas dans la liste
    # Retourne l'élément HashableImpl
    def find(self,x): # Throws ItemNotFound
        index = x.hash(len(self.ht))
        while self.ht[index] is not None:
            if self.ht[index].key == x.key:
                return self.ht[index]
            index = (index + 1) % len(self.ht)
        raise ItemNotFound

class Error(Exception):
    pass

class ItemNotFound(Error):
    pass

In [2]:
def test_unexisting_value(hashable):
    try:
        ht.find(hashable)
        print("Error: the item '", hashable, "' must not exist in the hash table")
    except ItemNotFound:
        pass
    except Exception as e:
        print("Error: an unexpected exception has been raised", type(e), ":", e)
        raise

ht = HashTable()
assert ht.is_empty() == True
h1 = HashableImpl(156)
ht.insert(h1)
assert ht.is_empty() == False
h2 = HashableImpl(90)
ht.insert(h2)
h3 = HashableImpl(31)
ht.insert(h3)
print("Should display three elements, while the other entries should be None:")
for e in ht.ht:
    if e is not None:
        if e.is_active:
            print(e)
    else:
        print(e)
print()

test_unexisting_value(HashableImpl(0))
test_unexisting_value(HashableImpl(1))
assert ht.find(h1) != None
assert ht.find(h2) != None
assert ht.find(h3) != None

temp1 = ht.find(h1)
print("h1: ", temp1.key)
temp3 = ht.find(h3)
print("h3: ", temp3.key)
print()
ht.remove(h2)
print("Should display two elements, while the other entries should be None:")
for e in ht.ht:
    if e is not None:
        if e.is_active:
            print(e)
        else:
            print(None)
    else:
        print(e)
print()

test_unexisting_value(HashableImpl(0))
test_unexisting_value(HashableImpl(1))
assert ht.find(h1) != None
test_unexisting_value(h2)
assert ht.find(h3) != None

h4 = HashableImpl(41)
ht.insert(h4)
h5 = HashableImpl(54)
ht.insert(h5)
print("Should display four elements, while the other entries should be None:")
for e in ht.ht:
    if e is not None:
        if e.is_active:
            print(e)
        else:
            print(None)
    else:
        print(e)

print()

test_unexisting_value(HashableImpl(0))
test_unexisting_value(HashableImpl(1))
assert ht.find(h1) != None
test_unexisting_value(h2)
assert ht.find(h3) != None
assert ht.find(h4) != None
assert ht.find(h5) != None

h6 = HashableImpl(716)
ht.insert(h6)
print("Should display five elements, while the other entries should be None:")
for e in ht.ht:
    if e is not None:
        if e.is_active:
            print(e)
        else:
            print(None)
    else:
        print(e)

print()

test_unexisting_value(HashableImpl(0))
test_unexisting_value(HashableImpl(1))
assert ht.find(h1) != None
test_unexisting_value(h2)
assert ht.find(h3) != None
assert ht.find(h4) != None
assert ht.find(h5) != None
assert ht.find(h6) != None

ht.make_empty()
assert ht.is_empty() == True
print("Should display all entries as None:")
for e in ht.ht:
    if e is not None:
        if e.is_active:
            print(e)
        else:
            print(None)
    else:
        print(e)

print()

test_unexisting_value(HashableImpl(0))
test_unexisting_value(HashableImpl(1))
test_unexisting_value(h1)
test_unexisting_value(h2)
test_unexisting_value(h3)
test_unexisting_value(h4)
test_unexisting_value(h5)
test_unexisting_value(h6)

try:
    ht.remove(h4)
    print("Error: an ItemNotFound exception must be raised")
except ItemNotFound:
    pass
except Exception as e:
    print("Error: an unexpected exception has been raised", type(e), ":", e)
    raise

Should display three elements, while the other entries should be None:
156
None
90
None
None
None
None
None
None
31
None


ItemNotFound: 

### Explications

### **1. Création de la structure `HashableImpl`**
Nous avons utilisé la classe `HashableImpl` pour représenter les éléments qui seront stockés dans la table de hachage. Chaque élément possède une clé unique (par exemple, un nombre entier) et un statut `is_active` pour savoir si l'élément est toujours valide dans la table.

- La méthode `hash` permet de déterminer l'index où l'élément doit être placé dans la table. Cela se fait en prenant la clé de l'élément et en la divisant par la taille de la table (`key % table_size`).

### **2. Gestion de la table de hachage (`HashTable`)**

Pour résoudre les problèmes de stockage d'éléments dans une table de hachage, nous avons completé les functions suivantes :

- **Initialisation** : La table commence vide avec une taille de 0. Lors de l'insertion du premier élément, une taille par défaut est utilisée pour la table. Cela permet de gérer les éléments même si la table est vide au départ.
  
- **Insertion** : Lorsque l'on insère un élément, nous calculons d'abord sa position avec le hash. Si cette position est déjà occupée (collision), on utilise une stratégie de *dispersion linéaire* : on cherche la prochaine case libre en avançant d'une case à la fois. Chaque fois qu'une collision se produit, un compteur de collisions est incrémenté pour savoir combien de fois cette situation a eu lieu.

- **Suppression** : Lorsqu'un élément est supprimé, on marque cet élément comme inactif au lieu de le supprimer vraiment. Cela permet de gérer les éléments supprimés sans perturber les autres éléments dans la table. Si l'élément n'est pas trouvé, une exception `ItemNotFound` est levée.

- **Recherche** : Pour trouver un élément, on utilise la même méthode que pour l'insertion. On commence par calculer l'index, puis on vérifie si l'élément est à cet endroit. Si la case est occupée par un autre élément, on avance d'une case à la fois jusqu'à trouver l'élément ou constater qu'il n'existe pas.


### Exercice 1.1
Créer une hash table de taille 997. Disperser dans la table $n$ clés, pour chaque $n$ entier dans $[200,900]$.



```python
    # Dispersion
    for i in range(n):
        a_key = np.random.randint(4242)
        h = HashableImpl(a_key, True)
        hash_table.insert(h)
```



Un *miss* (similaire à une collision) est, lors d'une phase de sondage, la visite d'une cellule de la table qui ne correspond pas à la clé recherchée.

Pour chaque $n$, afficher le nombre de *miss* pour 100 requêtes `find` de clés existantes (les choisir au hasard).





Quelle est la relation entre le facteur de charge (load factor) de la table de hachage et le nombre de miss ?

### Exercice 1.2
Quelle est la particularité de 997, la taille choisie pour la hash table ?

<< A REMPLIR PAR L'ETUDIANT >>