In [14]:
from dataclasses import dataclass
from __future__ import annotations

import numpy as np

# Instructions de flot de contrôle:
# - Sequence: retour à la ligne
# - Branchement: if: // elif: // else: //
# - No-op: pass
# - Boucle for: for i in range(start, stop, step): //
# - Boucle while: while cond: //
# - Sortie boucle: break
# - Itération suivante: continue


# Liste des valeurs définies en mini-python
from numpy import Infinity

# Liste des fonctions définies en mini-python
min, max
from numpy import sqrt
from numpy import floor
from numpy import abs
from numpy import exp, log
from numpy import sin, cos, tan
from numpy import arcsin, arccos, arctan
from numpy import sinh, cosh, tanh
from numpy import arcsinh, arccosh, arctanh
from numpy import mod

def size(t):
    shape = np.shape(t)
    if np.ndim(t) == 1:
        return shape[0]
    else:
        return shape

def rand():
    return np.random.random()

def vector(n):
    if np.isscalar(n):
        return np.zeros(n)
    else:
        return np.array(n)
    
def matrix(n, m):
    return np.zeros((n, m))

def tensor(*args):
    return np.zeros(args)

def array(a):
    return np.array(a)

def length(s):
    return len(s)

def substr(s, begin, length):
    return s[begin:begin+length]

In [15]:
# Enregistrements associe un identifiant à une valeur
@dataclass
class Person:
    name: str
    age: int
    size: float
        
p = Person('test', 10, 10.0)
p.name, p.age, p.size

('test', 10, 10.0)

# Tableaux (*array*)

## Définition

### Tableaux à une dimension / Tableaux multi-dimensionnels

## Tableaux triés

- Première optimisation possible pour des algos s'éxécutant en temps sup-linéaire sur des données non triées
- Trois algos vus depuis le début de ce cours: tri par insertion, tri par sélection et le tri-fusion.

### Définition: algorithme de tri
Soit E un ensemble muni d’une relation d’ordre total $\leq$ et T un tableau d’éléments de E :

$$
T = [x_0, x_1, \dots, x_n ], x_i \in E
$$

Un **algorithme de tri** est une procédure prenant en entrée le tableau T, et le réordonnant suivant une permutation $\sigma$ :

$$
T = [x_{\sigma(0)}, x_{\sigma(1)}, \dots, x_{\sigma(n)} ]
$$

de sorte à avoir :
$x_{\sigma(0)} \leq x_{\sigma(1)} \leq \dots \leq x_{\sigma(n)}$

Deux types de tri :
- Tri avec création de tableau temporaire
- Tri en place (i.e. $C_{spatiale} = O(1)$)

### Définition : stabilité
Un algorithme de tri de listes est dit **stable** si et seulement si pour tout tableau T = $[x_0 , x_1 , \dots, x_n ]$ passé en entrée, on a :
$$
\forall (i, j) \in {1, n}^2, i<j,
xi = xj \Longrightarrow \sigma(i) < \sigma(j)
$$

## Tri rapide (*quick sort*)

In [16]:
def partition(t, i, j):
    x = t[i] # Choix du pivot
    l = i - 1
    for k in range(i, j, 1):
        if t[k] <= x:
            # Echange de t[k] et t[l]
            l = l + 1
            tmp = t[k]
            t[k] = t[l]
            t[l] = tmp
    tmp = t[i]
    t[i] = t[l + 1]
    t[l + 1] = tmp
    print(t)
    return l + 1

def sort(t, i, j):
    if i == j: # le tableau ne contient qu'un seul élément
        return
    print('sort')
    print(i, j)
    # decoupage en sous-problème
    pivot = partition(t, i, j)
    # resolution des sous-problèmes
    sort(t, i, pivot - 1)
    sort(t, pivot + 1, j)
    return

def quicksort(t):
    sort(t, 0, size(t))

## Tri de complexité optimale

### Théorème : borne inférieure sur la complexité d’un tri par comparaison
La complexité dans le pire des cas de tout algorithme de tri de tableaux par comparai-
sons est au moins quasi-linéaire :
C(n) = Ω(n log n)

# Listes chaînées (*linked list*)

- Accès séquentiel
- Pointeurs (référence et explication au tableau)

## Liste simplement chaînée (*singly linked list*)
- Valeur de l'élément
- Référence à l'élément suivant ou `None` (fin de liste)
```python
# Un enregistrement contenant:
# - une valeur de type quelconque
# - une référence au noeud suivant (ou None, référence vide)
@dataclass
class Node:
    val: any
    next: Node
```
```python
# Un enregistrement référençant le noeud de tête
@dataclass
class LinkedList:
    head: Node
```

## Liste doublement chaînée (*doubly linked list*)
```python
# On ajoute un champ référençant le noeud précédent
@dataclass
class DoublyNode:
    val: any
    next: Node
    prev: Node
```
```python
# Un enregistrement référençant le noeud de tête
@dataclass
class DoublyLinkedList:
    head: Node
```

## Liste chaînée circulaire (*circular linked list*)
```python
# La référence de queue de liste next référence la tête de liste
# i.e. l.head.prev = l.tail
# La référence de tête de liste prev référence la queue de liste
# i.e. l.tail.next = l.head
@dataclass
class Node:
    val: any
    next: Node
    prev: Node
```
```python
# Un enregistrement référençant le noeud de tête et de queue
@dataclass
class LinkedList:
    head: Node
    tail: Node
```


## Fonctionnalités

In [4]:
@dataclass
class Node:
    val: any
    next: Node
        
@dataclass
class LinkedList:
    head: Node

def list_empty():
    return LinkedList(None)

def list_size(l):
    size = 0
    cur = l.head
    while not (cur == None):
        cur = cur.next
        size = size + 1
    return size

def list_head(l):
    return l.val

def list_tail(l):
    while not (l.next == None):
        l = l.next
    return l.val

def list_head(l):
    return l.head.val

def list_tail(l):
    cur = l.head
    while not (cur.next == None):
        cur = cur.next
    return cur.val

def list_prepend(l, x):
    node = Node(x, l.head)
    l.head = node

# File et pile (*queue and stack*)

Une file (resp. pile) est une structure de données contenant un ensemble d’éléments et
munie de fonctions permettant essentiellement d’effectuer les trois opérations suivantes :
- `size` : retourner la taille de la file (i.e. son nombre d’éléments)
- `add` : ajouter un élément en tête de liste
- `pop` : retirer l’élément de queue (resp. tête) de liste

On l'implémente généralement avec une **liste chaînée doublement circulaire**.

# Arbre (*tree*)
## Définitions

- Racine
- Profondeur
- Fils d'un noeud: successeur
- Parent d'un noeud : prédécesseur
- Feuille: Pas de successeur

### Définition : arbre binaire
On appelle arbre binaire, un arbre dont chaque noeud possède au plus deux fils.

### Définition : arbre binaire complet
On appelle arbre binaire complet, un arbre binaire dont toutes les feuilles ont la même profondeur.

### Définition : profondeur d'un arbre
On appelle profondeur d’un arbre, la profondeur maximale des feuilles de l’arbre

In [5]:
@dataclass
class Tree:
    val: any
    left: Tree # ou None
    right: Tree # ou None
    parent: Tree # ou None
        
def depth(t):
    if t == None:
        return 0
    if t.left == null:
        return 1
    if t.right == null:
        return 1 + depth(t.left)
    return 1 + max(depth(t.left), depth(t.right))

## Parcours d'un arbre

Voir pages 174-175 du cours papier :
- Parcours en profondeur (préfixe, suffixe, infixe)
- Parcours en largeur

## Arbre binaire de recherche (*Binary Search Tree*)
- Chaque valeur d'un noeud du sous-arbre gauche est inférieur ou égale à celle du noeud parent qui est elle-même inférieure à celle du sous-arbre droit

### Définition : arbre binaire équilibré
Un arbre binaire de recherche est dit équilibré si, pour chaque noeud, la haut de chacun des deux sous-arbres partant de ce noeud diffère au plus de 1.

## Exemples d'application

- Tri par tas
- Codage de Huffman
- Arbre d'expression algébriques
- Arbre de décision

# Tables de hachage

Une table de hachage est utile dès lors que l’on souhaite former des couples de type (clé, valeur) et que la suite de clés n’est pas une suite de nombre entiers (ce qui aurait permis un référencement simple dans un tableau, où chaque ligne serait occupée par le couple dont
la clé correspond au numéro de la ligne en question).

Pour pouvoir permettre un accès rapide aux valeurs à partir des clés, une telle table est munie d’une fonction de hachage. Soit Ω l’ensemble des clés possibles (Ω est bien souvent de cardinal infini, c’est en particulier les cas pour des chaîne de caractères). Une fonction de hachage est alors une fonction h, sur Ω, à valeurs entières dans {0, 1, ..., m − 1}, où m est la taille du tableau de données à garnir :

$$
\begin{align}
h : Ω &→ {0, 1..., m − 1} \\
k &→ h(k)
\end{align}
$$

- **Collision** des clés (voir théorème du tiroir à chaussette ou pigeonnier)
- **Stratégies** en cas de collision:
  + **sondage linéaire** (si élément à la position, on ajoute à l'emplacement suivant si libre, sinon on continue)
  + utilisation de liste chaînées à chaque index (**bucket**), pas abordé en cours mais bon à connaître !

# Implémentation

- `contains_key(k)`: retourne rai si la clé a été recensée dans la table
- `get(k)`: retourne la valeur associée à `k`
- `put(k, v)`: insertion du couple `(k, v)` dans la table
- `remove(k)`: suppression du couple associé à `k`

# Exercices
## Exercice 4.10 : Tri stupide (*bogo-sort*)


In [6]:
def shuffle(a):
    n = size(a)
    for i in range(0, n, 1):
        j = floor(rand() * (n - 1))
        a[i], a[j] = a[j], a[i]

def is_sorted(a):
    n = len(a)
    for i in range(1, n, 1):
        if (a[i - 1] > a[i + 1]):
            return False
    return True
        
def bogoSort(a):
    n = len(a)
    while (not is_sorted(a)):
        shuffle(a)

**Nombre de permutations possibles**: Il y a $n!$ façons de disposer les $n$ éléments de la liste de manière aléatoire. Cela correspond au nombre total de permutations.

**Pire cas**: $+\infty$

**Moyenne**: $O(n!)$

**Meilleur cas**: $O(n)$

- Tri en place ? Oui.
- Stable ? Non.

## Exercice 4.11: Fonctions de base sur les listes chaînées

In [10]:
def list_has(l, x):
    cur = l.head
    while (cur != None):
        if (cur.val == x):
            return True
        cur = cur.next
    return False

def list_replace(l, i, x):
    cur = l.head
    idx = 0
    while (cur != None):
        if (idx == i):
            cur.val = x
            return
        cur = cur.next
        idx = idx + 1
        
def list_count(l, x):
    cur = l.head
    count = 0
    while (cur != None):
        if (cur.val == x):
            count = count + 1
        cur = cur.next
    return count

def list_swap(l, i, j):
    cur = l.head
    idx = 0
    node_i = l.head
    while (cur != None):
        if (idx == i):
            node_i = cur
        elif (idx == j):
            node_j = cur
        elif (i < idx and j < idx):
            break
        cur = cur.next
        idx = idx + 1
    node_i.val, node_j.val = node_j.val, node_i.val

## Exercice 4.12 : Liste doublement chaînée circulaire

In [11]:
@dataclass
class CircularLinkedList:
    val: any
    next: LinkedList
    prev: LinkedList

## Exercice 4.13 : Ordre de parcours dans un arbre

Notation polonaise inversée :
$3 5 2 x 4 − 3 + \times 5 y + \div + 4 − \times 2 \times 1 a − 7 \times + 8 + \times$

Dans cette notation, vous effectuez les opérations à partir de la gauche en utilisant une pile pour stocker temporairement les opérandes. Lorsque vous rencontrez un opérateur, vous l'appliquez aux opérandes les plus récents de la pile.

## Exercice 4.16 : Nombres de feuilles dans un arbre


In [12]:
def btree_leaf_count(root):        
    if root == None:
        return 0
    elif root.left == None and root.right == None:
        return 1
    else:
        left = btree_leaf_count(root.left)
        right = btree_leaf_count(root.right)
        return left + right

## Exercice 4.17 : Nombres de noeuds dans un arbre

In [13]:
def btree_node_count(root):
    if root == None:
        return 0
    else:
        left = btree_node_count(root.left)
        right = btree_node_count(root.right)
        return 1 + left + right

## Exercice 4.18 : Arbre peigne droit

Pour créer un arbre peigne droit à partir d'un tableau de valeurs T, vous pouvez utiliser un parcours linéaire du tableau en ajoutant les éléments un par un à l'arbre. Vous devez vous assurer que l'arbre résultant est un arbre binaire avec la propriété spécifiée, c'est-à-dire que le nombre de feuilles f et la hauteur h vérifient h+1=f.

Cette fonction crée un arbre peigne droit en ajoutant chaque élément du tableau un par un à l'arbre. La fonction AJOUTER_NOEUD prend en charge l'ajout du nœud à gauche du dernier nœud à la profondeur actuelle. Elle vérifie également si la propriété de l'arbre peigne droit est respectée, et si ce n'est pas le cas, elle génère une erreur.

## Exercice 4.19 : Vérification d'ABR

Cette fonction prend en compte les valeurs minimales et maximales autorisées pour chaque nœud. Initialement, vous pouvez appeler la fonction avec des valeurs infinies pour min_val et max_val. La fonction retourne vrai si l'arbre est un ABR et faux sinon.

La complexité algorithmique dans le pire des cas de cette fonction est O(n), où n est le nombre total de nœuds dans l'arbre. Chaque nœud est visité exactement une fois lors de l'exécution de l'algorithme, car il vérifie la propriété de l'ABR pour chaque nœud. La fonction est récursive, mais chaque appel récursif descend dans un sous-arbre différent, et le nombre total d'appels récursifs est proportionnel au nombre total de nœuds dans l'arbre.

In [None]:
def btree_is_bstree(root, min, max):
    if root == None:
        return True
    if root.val <= min or root.val >= max:
        return false
    is_left_bstree = btree_is_bstree(root.left, min, root.val)
    is_right_bstree = btree_is_bstree(root.right, root.val, max)
    return is_left_bstree and is_right_bstree

## Exercice 4.20 : Maximum d’un ABR

La complexité de cette fonction est proportionnelle à la hauteur de l'arbre, qui est O(log⁡n) dans le cas moyen pour un ABR équilibré, où n est le nombre total de nœuds. Cependant, dans le pire des cas (lorsque l'arbre est dégénéré et ressemble à une liste chaînée), la hauteur est O(n), où n est le nombre total de nœuds, et la complexité devient O(n).

En ce qui concerne la complexité asymptotique dans le pire des cas d'un tri de liste utilisant une structure d'ABR, cela dépend du type d'ABR utilisé. Si l'ABR est équilibré (comme un ABR AVL ou un ABR rouge-noir), la complexité du tri serait O(nlog⁡n) dans le pire des cas, car chaque opération d'insertion et de recherche prendrait O(log⁡n) dans un arbre équilibré.

Cependant, si l'ABR est dégénéré (comme une liste chaînée), la complexité du tri serait O(n2) dans le pire des cas, car chaque opération d'insertion ou de recherche prendrait O(n) dans un arbre dégénéré.

In [None]:
def bstree_max(root):
    while (root.right != None):
        root = root.right
    return root.val

## Exercice 4.21 : Table de hachage

**Q1**. Coût d'accès à un tableau, soit O(1)

**Q2**. Recherche dichotomique sur une liste triée (avec l'ordre total alphanumérique) : $O(n.log(n))$

**Q3**.
"Le Tour du Monde en 80 jours" (31 chars, mod 10 = 1) => Case 1

"Les 10 Petits Nègres" (21 chars, mode 10 = 1) => Case 1 => Case 2

"Les Aventures de Sherlock Holmes" (31 chars, mod 10 = 1) => Case 1 => Case 2 => Case 3

"L'Ile au Trésor" (17 chars, mod 10 = 7) => Case 7

"Les Misérables" (15 chars, mod 10 = 5) => Case 5

"Le Petit Prince" (15 chars, mod 10 = 5) => Case 6

"Guerre et Paix" (13 chars, mod 10 = 3) => Case 3 => Case 4

"Germinal" (8 chars, mod 10 = 8) => Case 8

"Le Rouge et le Noir" (19 chars, mod 10 = 9) => Case 9

**Q4**. h("Guerre et Paix") = 3 => Case 3 => Comparaison fausse => Case 4 => Comparaison vraie => retour

**Q5**. Pour l'ensemble de données ci-dessous, en moyenne l'accès de fait en 1,3 comparaisons.

**Q6**. Facteur de charge = nombre d'éléments stockés / taille totale hashtable

Ici, 10/10 = 1

## Exercice 4.22. File de priorité dynamique

Un tas binaire minimum est une structure de données arborescente
particulière utilisée en informatique, et plus précisément en
algorithmique et en structures de données.
Il s'agit d'un type de tas, également appelé tas min,
qui a la propriété suivante : la valeur de chaque nœud est
inférieure ou égale à celles de ses enfants.

Un tas binaire minimum est généralement implémenté sous forme
d'un arbre binaire complet, ce qui signifie que tous les niveaux
de l'arbre sont complètement remplis, à l'exception peut-être
du dernier niveau, qui est rempli de gauche à droite.

**Q1** et **Q2**. Pour une noeud à l'emplacement $i$, accès aux enfants $2i+1$ (enfant gauche) et $2i+2$ (enfant droite)

**Q3**. Indice du parent du noeud à l'emplacement $i$ donné par $\lfloor (i-1) / 2 \rfloor$

**Q4**.
- **Ajout à la fin du tableau** (i.e. à la prochaine position libre dans l'ordre de parcours en largeur)
- **Réajustement vers le haut** : Comparaison la valeur de l'élément ajouté avec son parent. Si la valeur de l'élément est plus petite que celle de son parent, échange des deux. Itération de cette étape jusqu'à ce que l'invariant du tas soit restauré (ou qu'on atteigne la racine)

**Q5**.
Pour créer un tas binaire à partir d'un tableau non trié, vous pouvez utiliser un processus appelé "construction du tas" ou "heapify". L'idée est de commencer par le dernier nœud non feuillu (qui est à l'indice ⌊taille du tableau2⌋⌊2taille du tableau​⌋) et de faire un ajustement descendant (sift down) pour chaque nœud, en partant du bas de l'arbre jusqu'à la racine.

Voici une implémentatin en mini-python :

```python

def build_heap(heap):
    n = size(tas)

    # Commence par le dernier nœud non feuillu
    start = n // 2 - 1

    # Effectue l'ajustement descendant pour chaque nœud, de la droite vers la gauche
    for i in range(start, -1, -1):
        percolate_down(heap, i, n)

def percolate_down(heap, i, n):
    imin = i
    left = 2 * i + 1
    droit = 2 * i + 2

    # Trouve l'indice du plus petit élément parmi le nœud actuel,
    # son enfant gauche et son enfant droit
    if gauche < n and heap[left] < heap[imin]:
        imin = left

    if droit < n and heap[right] < heap[imin]:
        imin = right

    # Si l'indice du plus petit élément n'est pas le nœud actuel,
    # échange-les et continue l'ajustement descendant
    if imin != i:
        heap[i], heap[imin] = heap[imin], heap[i]
        percolate_down(heap, imin, n)
```
        
La complexité dans le pire des cas de cet algorithme de construction de tas est $O(n)$, où $n$ est la taille du tableau. Cela est dû au fait que chaque appel à la fonction ajuster_descendant a une complexité de temps $O(\log⁡ n)$, et il y a $n/2$ appels nécessaires pour construire le tas. Ainsi, la complexité totale est $O(n \log ⁡n/2)$.

**Q6**. La fonction PERCOLATE_DOWN est généralement utilisée dans le contexte de la mise en œuvre de tas binaires. Elle effectue une percolation vers le bas à partir d'un élément à une position spécifique pour restaurer la propriété du tas. La percolation vers le bas consiste à déplacer l'élément vers le bas de l'arbre jusqu'à ce que la propriété du tas soit rétablie.

Cette fonction prend en compte la position $i$ de l'élément dans le tableau, la taille actuelle du tas, et elle effectue les comparaisons nécessaires pour déterminer si l'élément doit être échangé avec l'un de ses enfants. La récursion est utilisée pour poursuivre la percolation vers le bas si nécessaire.

Vous pouvez appeler cette fonction lorsque vous souhaitez effectuer une percolation vers le bas à partir d'une position spécifique dans votre tas. Par exemple, si vous avez un élément à la position $i$ dans votre tas, vous pouvez appeler PERCOLATE_DOWN(heap, i, n) pour effectuer la percolation vers le bas depuis cette position.