# Série 9

Ce document contient les différents exercices à réaliser. Veuillez compléter et rendre ces exercices dans deux semaines.

Pour chaque exercice:
* implémentez ce qui est demandé
* commentez votre code
* expliquez **en français** ce que vous avez codé dans la cellule correspondante

Dans vos explications à chacun des exercices, indiquez un pourcentage subjectif d'investissement de chaque membre du groupe.
**Des interrogations aléatoires en classe pourront être réalisées pour vérifier votre contribution/compréhension**.

Les tentatives infructueuses, les explications, commentaires et analyses des échecs **rapportent des points**. Ne rendez pas copie-blanche, même si votre fonction n'est pas correcte.

## Contributions
*Exercice : [contribution Radomski, contribution Darmanger]*
- 1 : [40%, 60%]
- 2 : [40%, 60%]

## Exercice 1
Écrivez une file de priorité (priority queue) à l'aide d'une structure de donnée "monceau" (heap), appelée `BinaryHeap`. La classe doit implémenter l'interface `PriorityQueue`.

La solution doit également comporter des classes qui modélisent les éléments à insérer dans la priority queue. À cette fin, écrivez la class `KeyValuePair` qui implémentes l'interface `Comparable`, en utilisant un nombre entier comme clé et une chaîne de caractères comme valeur.

In [1]:
#
# > Cette cellule n'a pas besoin d'être modifiée pour la série !
#

# Une interface qui indique un contrat pour des instances qui peuvent être comparables.
class Comparable:
    # Vérifie si cet objet est plus petit qu'un autre objet o
    # Retourne True si l'objet courant est plus petit que o
    # Retourne False si l'objet courant n'est pas plus petit que o
    def less_than(self, rhs) -> bool:
        raise NotImplementedError

    # Compare cet objet avec un autre objet o
    # Retourne un entier négatif si cet objet est plus petit que o
    # Retourne un entier positif si cet objet est plus grand que o
    # Retourne un 0 si cet objet est égal à o
    def compares(self, rhs) -> int:
        raise NotImplementedError

# An interface that specifies the primitives of a priority queue.
class PriorityQueue:
    # Ajoute un objet Comparable (x) dans le heap
    def insert( self, x ): # x is of type Comparable
        raise NotImplementedError

    # Supprime et retourne l'entrée la plus petite
    def delete_min(self) -> Comparable: # throws UnderflowException
        raise NotImplementedError

    # Retourne le plus petit élément sans le supprimer
    def find_min(self) -> Comparable: # throws UnderflowException
        raise NotImplementedError

    # Supprimer toutes les entrées du heap
    def make_empty(self):
        raise NotImplementedError

    # Détermine si la collection est vide
    def is_empty(self) -> bool:
        raise NotImplementedError

    # Retourne le nombre d'éléments stockés dans la collection
    def size(self) -> int:
        raise NotImplementedError

# L'exception est levée lors d'accès aux éléments d'une collection vide
class UnderflowException(Exception):
    pass

In [2]:
# L'implémentation à écrire pour l'élément inséré dans le monceau.
class KeyValuePair(Comparable):
    # Astuce: reprendre les fonctions déclarées dans l'interface Comparable et les implémenter ici.
    def __init__(self, key: int, value: str):
        self.key = key
        self.value = value

    # Permet de récupérer la clé
    def get_key(self):
        return self.key

    # Permet de récupérer la valeur
    def get_value(self):
        return self.value

    def less_than(self, rhs) -> bool:
        return self.key < rhs.get_key()

    def compares(self, rhs) -> int:
        if self.key < rhs.get_key():
            return -1
        elif self.key > rhs.get_key():
            return 1
        return 0

In [3]:
# L'implémentation à écrire avec un monceau, implémentant l'interface PriorityQueue.
class BinaryHeap(PriorityQueue):
    def __init__(self):
        self.array = [None]  # Tableau initial avec un élément None (pour indexation à partir de 1)
        self.current_size = 0

    def is_empty(self):
        return self.current_size == 0

    def size(self):
        return self.current_size

    def make_empty(self):
        self.array = [None]
        self.current_size = 0

    def insert(self, x: KeyValuePair):
        # Ajoute un élément à la fin du tableau
        self.array.append(x)
        self.current_size += 1
        # Remonte l'élément ajouté à la bonne position dans le monceau (pour maintenir la propriété de monceau)
        self._percolate_up(self.current_size)

    def find_min(self) -> KeyValuePair:
        if self.is_empty():
            raise UnderflowException("Heap is empty.")
        # Retourne la racine du monceau, qui est l'élément le plus petit (propriété de monceau)
        return self.array[1]

    def delete_min(self) -> KeyValuePair:
        if self.is_empty():
            raise UnderflowException("Heap is empty.")
        # Récupère l'élément le plus petit (la racine) et garde une référence temporaire
        min_item = self.array[1]
        # Remplace la racine par le dernier élément du tableau
        self.array[1] = self.array[self.current_size]
        # Diminue la taille du tableau
        self.current_size -= 1
        # Supprime le dernier élément du tableau (qui est maintenant à la racine)
        self.array.pop()
        # Fait descendre la nouvelle racine à la bonne position dans le monceau (pour maintenir la propriété de monceau)
        self._percolate_down(1)
        # Retourne l'élément le plus petit (l'ancienne racine) qui a été supprimé
        return min_item

    def _percolate_up(self, idx):
        # Rappel : l'indice du parent d'un élément à l'indice i est i // 2
        # tant que l'élément n'est pas la racine 
        while idx // 2 > 0:
            parent = idx // 2
            # Si le sommet est plus petit que le parent
            if self.array[idx].less_than(self.array[parent]):
                # On échange les deux éléments (le parent devient l'enfant et l'enfant devient le parent)
                self.array[idx], self.array[parent] = self.array[parent], self.array[idx]
                idx = parent
            else:
                # Si l'élément est à sa place, on arrête (le monceau est correct)
                break

    def _percolate_down(self, idx):
        # tant que l'élément a au moins un enfant
        while (idx * 2) <= self.current_size:
            min_child = self._min_child(idx)
            # Si l'enfant est plus petit que l'élément courant
            if self.array[min_child].less_than(self.array[idx]):
                # On échange les deux éléments (l'enfant devient le parent et le parent devient l'enfant)
                self.array[idx], self.array[min_child] = self.array[min_child], self.array[idx]
                idx = min_child
            else:
                # Si l'élément est à sa place, on arrête (le monceau est correct)
                break

    def _min_child(self, idx):
        # Rappel : l'indice du fils gauche d'un élément à l'indice i est 2i
        # Rappel : l'indice du fils droit d'un élément à l'indice i est 2i + 1

        # Si le fils droit est en dehors du tableau, on retourne l'indice du fils gauche
        if idx * 2 + 1 > self.current_size:
            return idx * 2
        else:
            left = idx * 2
            right = idx * 2 + 1
            # On retourne l'indice du fils le plus petit
            if self.array[left].less_than(self.array[right]):
                return left
            else:
                return right
            
    def __str__(self):
        return ', '.join([f'{item.get_key()}:{item.get_value()}' for item in self.array[1:]])+'\n\n'
    

In [4]:
pq = BinaryHeap()
assert pq.is_empty()
assert pq.size() == 0
kv1 = KeyValuePair(5, "a")
kv2 = KeyValuePair(3, "b")
kv3 = KeyValuePair(8, "c")
kv4 = KeyValuePair(7, "d")
kv5 = KeyValuePair(1, "e")

# Doit lever une exception de type UnderflowException.
try:
    pq.find_min()
except UnderflowException:
    pass

# Doit lever une exception de type UnderflowException.
try:
    pq.delete_min()
except UnderflowException:
    pass

pq.insert(kv1)
# LE HEAP DOIT ETRE [5, a] A CE STADE
print("LE HEAP DOIT ETRE [5, a]")
print(pq)
assert not pq.is_empty()
assert pq.find_min().get_key() == 5
assert pq.size() == 1

pq.insert(kv2)
# LE HEAP DOIT ETRE [3, b][5, a] A CE STADE
print("LE HEAP DOIT ETRE [3, b][5, a]")
print(pq)
assert pq.find_min().get_key() == 3
assert pq.size() == 2

pq.insert(kv3)
# LE HEAP DOIT ETRE [3, b][5, a][8, c] A CE STADE
print("LE HEAP DOIT ETRE [3, b][5, a][8, c]")
print(pq)
assert pq.find_min().get_key() == 3
assert pq.size() == 3

pq.insert(kv4)
# LE HEAP DOIT ETRE [3, b][5, a][8, c][7, d] A CE STADE
print("LE HEAP DOIT ETRE [3, b][5, a][8, c][7, d]")
print(pq)
assert pq.find_min().get_key() == 3
assert pq.size() == 4

pq.insert(kv5)
# LE HEAP DOIT ETRE [1 , e][3 , b][8 , c][7 , d][5 , a] A CE STADE
print("LE HEAP DOIT ETRE [1 , e][3 , b][8 , c][7 , d][5 , a]")
print(pq)
assert pq.find_min().get_key() == 1
assert pq.size() == 5

# Tests the primitives
list_of_key_value_pairs = []
for i in range(5):
    list_of_key_value_pairs.append(pq.delete_min())

list_of_key_value_pairs.reverse()
for i in range(len(list_of_key_value_pairs)):
    pq.insert(list_of_key_value_pairs[i])

# THE HEAP MUST BE [1 , e][3 , b][8 , c][7 , d][5 , a] AT THIS POINT
print("THE HEAP MUST BE [1 , e][3 , b][8 , c][7 , d][5 , a]")
print(pq)
assert pq.find_min().get_key() == 1
assert pq.size() == 5

min1 = pq.delete_min().get_key()
# LE HEAP DOIT ETRE [3 , b][5 , a][8 , c][7 , d] A CE STADE
print("LE HEAP DOIT ETRE [3 , b][5 , a][8 , c][7 , d]")
print(pq)
assert pq.find_min().get_key() == 3
assert pq.size() == 4
assert min1 == 1

min2 = pq.delete_min().get_key()
# LE HEAP DOIT ETRE [5 , a][7 , d][8 , c] A CE STADE
print("LE HEAP DOIT ETRE [5 , a][7 , d][8 , c]")
print(pq)
assert min2 == 3
assert pq.find_min().get_key() == 5
assert pq.size() == 3

pq.make_empty()
assert pq.size() == 0
assert pq.is_empty()

LE HEAP DOIT ETRE [5, a]
5:a


LE HEAP DOIT ETRE [3, b][5, a]
3:b, 5:a


LE HEAP DOIT ETRE [3, b][5, a][8, c]
3:b, 5:a, 8:c


LE HEAP DOIT ETRE [3, b][5, a][8, c][7, d]
3:b, 5:a, 8:c, 7:d


LE HEAP DOIT ETRE [1 , e][3 , b][8 , c][7 , d][5 , a]
1:e, 3:b, 8:c, 7:d, 5:a


THE HEAP MUST BE [1 , e][3 , b][8 , c][7 , d][5 , a]
1:e, 3:b, 7:d, 8:c, 5:a


LE HEAP DOIT ETRE [3 , b][5 , a][8 , c][7 , d]
3:b, 5:a, 7:d, 8:c


LE HEAP DOIT ETRE [5 , a][7 , d][8 , c]
5:a, 8:c, 7:d




Il y a une différence entre l'ordre pour les 3 derniers tests, cependant, la propriété du monceau est quand même respecté. L'on peut donc considérer que les tests sont corrects.

### Explications

**Notes**

Le code est quelque peu différent de celui vu sur les slides, car sur les slides on a un code plutôt adapté Java que Python. Nous nous sommes inspirer du code des slides en l'adaptant pour une utilisation standard en Python. Quelques exemples sont par exemple la gestion dynamique de la taille du tableau avec append/pop, ou suppression de fonctions comme `toss` qui n'est pas nécessaire dans ce contexte.

#### Classe `BinaryHeap`

- **Indexation et relations :**
Dans un monceau binaire avec une indexation qui commence à 1, chaque élément du tableau suit ces relations :
  - Parent d'un nœud à l'indice `i` : `i // 2`
  - Fils gauche d'un nœud : `2 * i`
  - Fils droit d'un nœud : `2 * i + 1`

- **Structure de données :**
  Le tableau commence par un élément `None` à l'indice `0` pour permettre une indexation à partir de `1`.


#### Fonctions principales
Description de quelques fonctions principales de la classe `BinaryHeap` :
1. `insert(x)`
   - Ajoute un nouvel élément à la fin du tableau (`append`)
   - Réorganise le monceau en utilisant `_percolate_up`, une méthode qui déplace l'élément vers le haut pour restaurer l'ordre du monceau

2. `delete_min()`
   - Supprime et retourne l'élément avec la clé minimale (la racine du heap, à l'indice `1`).
   - Remplace la racine par le dernier élément du tableau
   - Réorganise le monceau avec `_percolate_down`, une méthode qui déplace l'élément vers le bas (à la bonne position) pour restaurer l'ordre du monceau

3. `find_min()`
   - Retourne l'élément à la racine sans le supprimer. Lève une exception si le monceau est vide.


#### Algorithmes internes (fonctions utilitaires)
1. `_percolate_up(idx)`
   - Vérifie si l'élément à l'indice `idx` doit être échangé avec son parent pour respecter l'ordre du monceau.
   - Continue jusqu'à ce que l'élément atteigne sa position correcte ou la racine.

2. `_percolate_down(idx)`
   - Vérifie si l'élément à l'indice `idx` doit être échangé avec l'un de ses enfants pour respecter l'ordre du monceau.
   - Continue jusqu'à ce que l'élément atteigne sa position correcte ou une feuille.

3. `_min_child(idx)`
   - Retourne l'indice du fils ayant la plus petite clé (fils gauche ou fils droit).


#### Rappel : Notion du monceau (heap)
##### Insertion et "Remonter"
Lorsqu'on insère un élément dans un Min-Heap, il est ajouté à la première position libre (fin du tableau). Cependant, cet élément pourrait violer la propriété du Min-Heap (chaque parent est plus petit ou égal à ses enfants). Pour corriger cela, on utilise une opération appelée remonter (*percolate_up*), qui consiste à déplacer cet élément vers le haut de l'arbre jusqu'à ce que la propriété soit restaurée.

##### Exemple : Insertion de 2 dans un Min-Heap
Exemple avec un Min-Heap contenant les éléments suivants :
$[ \_, 5, 9, 6 ]$
Et qu'on insère $2$. Voici les étapes détaillées :

1. **Ajout de 2** :  
   Insérez $2$ à la fin (index $4$) :  
   $[ \_, 5, 9, 6, 2 ]$

2. **Vérifiez le parent** :  
   L'index de $2$ est $4$. Son parent est à :  
   $parent(4) = \lfloor 4 / 2 \rfloor = 2$  
   Le parent est $9$ (à l'index $2$).  
   Puisque $2 < 9$, on échange :  
   $[ \_, 5, 2, 6, 9 ]$

3. **Continuez à remonter** :  
   Maintenant, $2$ est à l'index $2$. Son parent est à :  
   $parent(2) = \lfloor 2 / 2 \rfloor = 1$  
   Le parent est $5$ (à l'index $1$).  
   Puisque $2 < 5$, on échange à nouveau :  
   $[ \_, 2, 5, 6, 9 ]$

4. **Arrêtez de remonter** :  
   $2$ est maintenant à la racine (index $1$). Il n'a plus de parent. La propriété du Min-Heap est restaurée.


##### Descendre ("percolate_down") 
Lorsqu'un élément est retiré du Min-Heap (typiquement la racine, qui est le minimum), l'élément le plus à droite de la dernière rangée est déplacé à la racine. Cependant, cela pourrait "casser" la propriété du Min-Heap. Pour corriger ça, on utilise une opération appelée descendre (*percolate_down*), qui consiste à déplacer cet élément vers le bas dans l'arbre, en le comparant avec ses enfants, jusqu'à ce que la propriété soit restaurée. Si l'élément est plus grand que ses enfants, on échange avec le plus petit des enfants (parmi ceux qui sont plus petits que lui). Cela garantit que la propriété du Min-Heap (le parent est toujours plus petit que ses enfants) est préservée à chaque niveau.

## Exercice 2
Utilisez votre implémentation de la structure de données priority queue pour trier efficacement une liste d'objets (une liste de candidats à une élection donnée) en fonction des votes reçus et des noms.

La liste reçue en input doit être donnée dans un fichier texte (disponible sur Moodle), en suivant le format: Nom,Votes

| Exemple d'input   | Exemple d'output   |
| :----------------:|:------------------:|
| John, 6           | George, 1          |
| Paul, 5           | Ringo, 3           |
| George, 1         | Paul, 5            |
| Ringo, 3          | John, 6            |

Pour ouvrir un fichier en utilisant jupyter notebook, vous devez le mettre au même niveau que ce fichier ipynb

In [None]:
import csv

# Lis le fichier et en crée une priority queue (typiquement en utilisant votre implémentation BinaryHeap)
def create_priority_queue() -> PriorityQueue:
    pq = BinaryHeap()
    
    # Lis le fichier d'entrée
    with open('s9ex2.txt', 'r') as file:
        reader = csv.reader(file)
        for row in reader:
            name, votes = row[0].strip(), int(row[1].strip())
            # Crée un KeyValuePair avec les votes comme clé et le nom comme valeur
            kvp = KeyValuePair(votes, name)
            # Ajoute le KeyValuePair à la priority queue
            pq.insert(kvp)
    
    return pq  # Retourne une instance de BinaryHeap remplie

# Crée une liste ordonnée à partir de la priority queue
def create_final_list(pq):
    ordered_list = [] # Liste ordonnée

    # Tant que la priority queue n'est pas vide, retire les éléments dans l'ordre croissant
    while not pq.is_empty():
        smallest = pq.delete_min() # Retire l'élément le plus petit (le plus petit nombre de votes)
        # Ajoute le nom et le nombre de votes à la liste ordonnée
        ordered_list.append((smallest.get_value(), smallest.get_key()))  
    
    # Retourne la liste triée (par votes croissants)
    return ordered_list

In [6]:
pq = create_priority_queue()
final_list = create_final_list(pq)
for x in final_list:
    print(x)

('George', 1)
('Bernard', 2)
('Ringo', 3)
('Paul', 5)
('John', 6)
('Steven', 7)
('James', 8)
('Brigitte', 15)
('Cheryl', 20)


### Explications

                    George(1)
                  /          \
            Bernard(2)      Ringo(3)
            /       \       /       \
        Paul(5)   John(6) Steven(7) James(8)
          /   \
    Brigitte(15) Cheryl(20)


On voit bien que c'est correct car l'arbre est complet et parent plus petit que ses enfants.

#### Propriétés qui garantissent le fonctionnement

-   **Propriété du Min-Heap** : La racine contient toujours l'élément avec la plus petite clé.
-   **Insertion (`insert`)** : Chaque nouvel élément est placé à la bonne position grâce à `_percolate_up`, maintenant l'ordre du Min-Heap.
-   **Suppression (`delete_min`)** : Chaque suppression retire l'élément minimal, réorganisant le reste du Min-Heap pour maintenir l'ordre.
-   **Tri final** : L'extraction répétée des éléments dans l'ordre croissant produit une liste triée.

#### Fonctionnement de l'algorithme
Étape 1 : Lecture du fichier et insertion dans la priority queue

-   Chaque ligne du fichier est transformée en un objet `KeyValuePair` :
    -   La clé : le nombre de vote
    -   La valeur : le nom du candidat
-   Ces objets sont insérés dans le Min-Heap :
    -   L'ordre est maintenu grâce à `_percolate_up`, qui place chaque nouvel élément à la bonne position.
    -   Cela garantit que la racine (le premier élément) est toujours le candidat avec le plus petit nombre de votes.

Étape 2 : Extraction des éléments dans l'ordre croissant

-   On utilise `delete_min()` pour retirer les éléments un par un du Min-Heap
    -   À chaque suppression, l'élément minimal (celui avec le moins de votes) est extrait
    -   Le Min-Heap est réorganisé pour maintenir ses propriétés.
-   Les éléments extraits sont ajoutés dans une liste finale, qui devient automatiquement triée

**Pourquoi cela produit une liste triée :**

-   Les éléments sont extraits dans l'ordre croissant des clés (votes) grâce aux propriétés du Min-Heap.
-   Chaque suppression garantit que le prochain élément extrait est le suivant dans l'ordre.

### Exercice 2.1
Quel est le coût (en termes de complexité de chaque opération) de votre solution? Justifiez votre réponse.

### Explications

- Insertion (`insert`) : O(log n)
  - Lorsqu’un élément est inséré, il est placé à la fin du tableau, puis déplacé vers le haut dans l’arbre pour respecter la propriété de min-heap. Ce déplacement (remontée) a une complexité proportionnelle à la hauteur de l’arbre, qui est logarithmique en fonction du nombre d’éléments (n).
    - Notes: pour ça que la fonction `toss()` du cours (qui n'a pas été implémenté ici) peut être intéressante dans certains cas. Car elle permet de réduire la complexité de l'insertion à O(1) vu qu'on ne fait pas de remontée, mais donc la propriété du min-heap ne serait pas respectée.

- Suppression du minimum (`delete_min`) : O(log n)
  - Supprimer le minimum (racine) nécessite de replacer le dernier élément à la racine, suivi d’une descente pour restaurer la propriété du tas. Cette descente traverse la hauteur de l’arbre, soit O(log n).

- Trouver le minimum (`find_min`) : O(1)
  - Le minimum est toujours situé à la racine (index 1 dans le tableau). Il suffit d’un accès direct sans parcours.

- Vider le tas (`make_empty`) : O(1)
  - Cette opération réinitialise le tableau et le compteur de taille, ce qui se fait en temps constant.

- Vérifier si le tas est vide (`is_empty`) : O(1)
  - Cette opération vérifie simplement si le compteur de taille est égal à zéro, ce qui se fait en temps constant.

- Obtenir la taille du tas (`size`) : O(1)
  - Retourne directement la valeur de l’attribut `current_size`, ce qui se fait en temps constant.


### Complexité finale du tri

1. **Insertion dans le Min-Heap** : Chaque insertion a une complexité de $O(\log n)$. Pour $n$ éléments, cette étape est de complexité $O(n \log n)$.
2. **Suppression des éléments** : Chaque suppression de l'élément minimum a une complexité de $O(\log n)$. Supprimer tous les éléments du tas pour construire la liste triée prend également $O(n \log n)$.

#### Complexité totale :
L'insertion et la suppression étant séquentielles, la complexité globale du tri est :

$ O(n \log n) + O(n \log n) = O(n \log n)$ 



### Notes sur l'implémentations :

La série a été fait en grande partie avant la fin de la théorie concernant le tri par monceau. Nous avons donc utilisé les connaissances acquises jusqu'à ce moment pour réaliser cette série. Donc, l'implementation dérive quelques peu comme dit plus haut dans le notebook. Mais, maintenant nous nous sommes rendu compte que la fonction `toss()` pourrait être intéressante à implémenter pour réduire la complexité de l'insertion. En effet, avec `toss()`, l'insertion aurait une complexité de $O(n)$ sans se soucier de la propriété du min-heap. Puis, ensuite on aurait utilisé une fonction `fix_heap()` pour rétablir la propriété du min-heap (commme vu en cours), qui a aussi une complexité de $O(n)$. Donc, la complexité totale de l'insertion serait de $O(n)$ au lieu de $O(n \log n)$. 

Au final la complexité global restera la même, mais l'insertion serait plus rapide.

- avec `toss()` : $O(n) + O(n \log n) = O(n \log n)$
- avec l'insertion classique : $O(n \log n) + O(n \log n) = O(n \log n)$