Qu'est-ce que tas ?
===================

Un **tas minimal** est un TAD (type abstrait de données) qui possède **l'interface** (les primitives) suivante(s) :
* créer un tas vide
* tester si un tas est vide
* entasser un élément
* extraire l'élément minimal du tas

Une **implémentation** efficace garantit que l'entassement et l'extraction sont en temps logarithmique $O(\log n)$.

L'objectif de ce notebook est d'implémenter un tas en POO sous forme d'arbre binaire complet, afin d'écrire un algorithme de tri efficace : quasi-linéaire, en $O(n \log n)$, le tri par tas (heapsort).

On considérera qu'on a défini un objet de type `Tas`, qu'on implémentera dans un deuxième temps seulement.

## L'interface

In [6]:
class Tas:
    def __init__(self):
        self.t=[0]
    def vide(self):
        return self.t[0]==0
    def entasse(self,e):
        self.t[0]+=1
        k=self.t[0]
        self.t.append(e)
        # tant que k>1 et que l'élément d'indice k est inférieur à l'élément d'indice k//2
        while k>1 and self.t[k]<self.t[k//2]:
            # échanger les éléments d'indice k et k//2
            self.t[k],self.t[k//2]=self.t[k//2],self.t[k]
            # diviser k par 2 (division entière)
            k//=2
    def extrait(self):
        minimum=self.t[1]
        k=self.t[0]
        self.t[1]=self.t[k]
        self.t[0]=k-1
        self.t.pop()
        i=1
        fini=False
        while not fini and i<=k//2:
            if 2*i<k:
                if 2*i+1<k:
                    if self.t[i]>self.t[2*i]:
                        if self.t[i]>self.t[2*i+1]:
                            if self.t[2*i]<self.t[2*i+1]:
                                self.t[2*i],self.t[i]=self.t[i],self.t[2*i]
                                i=2*i
                            else:
                                self.t[2*i+1],self.t[i]=self.t[i],self.t[2*i+1]
                                i=2*i+1
                        else:
                            self.t[2*i],self.t[i]=self.t[i],self.t[2*i]
                            i=2*i
                    else:
                        fini=True
                elif self.t[i]>self.t[2*i]:
                    self.t[2*i],self.t[i]=self.t[i],self.t[2*i]
                    fini=True
                else:
                    fini=True
            else:
                fini=True                   
        return minimum
    def affiche(self):
        print(self.t)

## Le tri par tas

**ex1** Compléter la fonction `tri`.

In [7]:
def heapsort(t):
    """
    cette fonction prend un tableau t en argument
    et renvoit ce tabeau trié
    >>> heapsort([80,76,14,50,35,22,29,56,44,85])
    [14, 22, 29, 35, 44, 50, 56, 76, 80, 85]
    """
    # construire un tas vide
    tas=Tas()
    # entasser tous les éléments de t, un par un
    tas.entasse(t)
    # construire une liste vide
    l=[]
    # jusqu'à ce que le tas soit vide,
    while not tas.vide():
        # extraire le minimum du tas et le met en fin de la liste
        l.append(tas.extrait())
    # renvoyer la liste
    return l

In [9]:
heapsort([80,76,14,50,35,22,29,56,44,85])

[[80, 76, 14, 50, 35, 22, 29, 56, 44, 85]]

## Papier crayon

L'idée est de représenter le tas par un arbre binaire complet, et de stocker cet arbre binaire complet dans un tabeau. Le tas est alors appelé un **tas binaire**, binary heap en Anglais.

**ex2** Dessiner un arbre binaire complet de racine 14, avec 80 comme fils gauche et 76 comme fils droit.

1. Cet arbre est-il un ABR ? Pourquoi ?

Cet arbre représent le tas obtenu en entassant 80, puis 76 et 14, dans cet ordre. Il possède la propriété de tas, que la racine a une étiquette qui est plus petite que les étiquettes des sous-arbres.

2. On souhaite entasser 50. Quel devra être l'arbre obtenu pour que la propriété de tas soit conservée, récursivement : chaque sommet doit porter une étiquette plus petite que les étiquettes de ses éventuels enfants ?

Le tas obtenu en entassant 80, 76 et 14 sera représenté par le tableau `[3, 14, 80, 76]` où le `3` initial est le nombre d'éléments du tas.

3. Vérifier que cela revient à numéroter les sommets de l'arbre en partant de 1 avec un parcours en largeur.

4. Quel sera alors le tableau représentant le tas après avoir entassé 50 ?

5. Après avoir inséré 35, on obtient l'arbre représenté par le tableau `[5, 14, 35, 76, 80, 50]`. Dessiner l'arbre.

L'algorithme d'insertion est le suivant :
  * on insère le nouvel élément en dernière position du tableau, c'est-à-dire le plus à gauche possible sur le dernier niveau de l'arbre.
  * tant que cet élément est plus petit que son parent, on les échange (sans remonter plus haut que la racine, évidemment !)
  
6. Après la première étape de cet algorithme, on obtient l'arbre représenté par `[6, 14, 35, 76, 80, 50, 22]`. Quel est le parent de l'élément `22`, d'indice `6` ? **De façon générale, quel est l'indice du parent de l'élément d'indice `k` ? L'indice de son (éventuel) fils gauche ? De son (éventuel) fils droit ?**

7. Combien de fois le 22 va-t-il remonter dans l'arbre ? Représenter l'arbre à la fin de l'algorithme d'entassement, sous forme d'arbre mais aussi sous forme de tableau.

8. Vérifier qu'une fois qu'on a entassé tous les éléments de la liste `[80, 76, 14, 50, 35, 22, 29, 56, 44, 85]` on obtient le tas binaire représenté par le tableau `[10, 14, 35, 22, 44, 50, 76, 29, 80, 56, 85]` et bien sûr représenter ce tas binaire sous forme d'arbre binaire. Numéroter les sommets en bianire, en largeur, en partant de 1 pour la racine.

9. Compléter l'implémentation ci-dessous.

10. Exhiber un vairant de boucle qui prouve la terminaison de la méthode `entasser` et en déduire la complexité de cette méthode dans le pire des cas.

11. Expliquer le fonctionnement de la méthode `extraire`.

12. Ecrire une fonction `validation` qui prend un tableau censé représenter un tas binaire et qui renvoie un booléen exprimant que ce tableau correspond bien à un tas binaire.

## L'implémentation

In [10]:
class Tas:
    def __init__(self):
        self.t=[0]
    def vide(self):
        return self.t[0]==0
    def entasse(self,e):
        self.t[0]+=1
        k=self.t[0]
        self.t.append(e)
        # tant que k>1 et que l'élément d'indice k est inférieur à l'élément d'indice k//2
        while k>1 and self.t[k]<self.t[k//2]:
            # échanger les éléments d'indice k et k//2
            self.t[k],self.t[k//2]=self.t[k//2],self.t[k]
            # diviser k par 2 (division entière)
            k//=2
    def extrait(self):
        minimum=self.t[1]
        k=self.t[0]
        self.t[1]=self.t[k]
        self.t[0]=k-1
        self.t.pop()
        i=1
        fini=False
        while not fini and i<=k//2:
            if 2*i<k:
                if 2*i+1<k:
                    if self.t[i]>self.t[2*i]:
                        if self.t[i]>self.t[2*i+1]:
                            if self.t[2*i]<self.t[2*i+1]:
                                self.t[2*i],self.t[i]=self.t[i],self.t[2*i]
                                i=2*i
                            else:
                                self.t[2*i+1],self.t[i]=self.t[i],self.t[2*i+1]
                                i=2*i+1
                        else:
                            self.t[2*i],self.t[i]=self.t[i],self.t[2*i]
                            i=2*i
                    else:
                        fini=True
                elif self.t[i]>self.t[2*i]:
                    self.t[2*i],self.t[i]=self.t[i],self.t[2*i]
                    fini=True
                else:
                    fini=True
            else:
                fini=True                   
        return minimum
    def affiche(self):
        print(self.t)

In [11]:
t=Tas()
for u in [80,76,14,50,35,22,29,56,44,85]:
    t.entasse(u)
    t.affiche()

[1, 80]
[2, 76, 80]
[3, 14, 80, 76]
[4, 14, 50, 76, 80]
[5, 14, 35, 76, 80, 50]
[6, 14, 35, 22, 80, 50, 76]
[7, 14, 35, 22, 80, 50, 76, 29]
[8, 14, 35, 22, 56, 50, 76, 29, 80]
[9, 14, 35, 22, 44, 50, 76, 29, 80, 56]
[10, 14, 35, 22, 44, 50, 76, 29, 80, 56, 85]


In [12]:
for k in range(10):
    print(t.extrait())
    t.affiche()

14
[9, 22, 35, 29, 44, 50, 76, 85, 80, 56]
22
[8, 29, 35, 56, 44, 50, 76, 85, 80]
29
[7, 35, 44, 56, 80, 50, 76, 85]
35
[6, 44, 50, 56, 80, 85, 76]
44
[5, 50, 76, 56, 80, 85]
50
[4, 56, 76, 85, 80]
56
[3, 76, 80, 85]
76
[2, 80, 85]
80
[1, 85]
85
[0]


In [14]:
heapsort([80,76,14,50,35,22,29,56,44,85])

[[80, 76, 14, 50, 35, 22, 29, 56, 44, 85]]

## La structure de tas comme file de priorité (heap queue) est déjà implémentée en Python

In [15]:
from heapq import heapify
t=[80,76,14,50,35,22,29,56,44,85]
heapify(t)
print(t)

[14, 35, 22, 44, 76, 80, 29, 56, 50, 85]


## File de priorité dynamique
On veut pouvoir modifier les priorités des éléments présents dans la file de priorité.

Cette structure permet en particulier d'implémenter l'algorithme de Dijkstra de façon efficace.

In [16]:
class FileP:
    def __init__(self):
        self.t=[0]
        self.val=dict()
        self.pos=dict()
    def vide(self):
        return self.t[0]==0
    def entasse(self,k,v):
        self.val[k]=v
        self.t[0]+=1
        self.t.append(k)
        self.pos[k]=self.t[0]
        self.__swim__(k)
    def __swim__(self,k):
        i=self.pos[k]
        while i>1 and self.val[self.t[i]]<self.val[self.t[i//2]]:
            self.t[i//2],self.t[i]=self.t[i],self.t[i//2]
            self.pos[self.t[i]]=i
            self.pos[self.t[i//2]]=i//2
            i//=2
    def extrait(self):
        k=self.t[1]
        v=self.val[k]
        del self.val[k]
        del self.pos[k]
        self.t[0]-=1
        kk=self.t.pop()
        self.t[1]=kk
        self.pos[kk]=1
        self.__sink__(kk)
        return k,v
    def __sink__(self,k):
        p=self.pos[k]
        if p*2<=self.t[0] and self.val[k]>self.val[self.t[2*p]] or p*2+1<=self.t[0] and self.val[k]>self.val[self.t[2*p+1]]:
            if p*2==self.t[0] or self.val[self.t[p*2]]<self.val[self.t[p*2+1]]:
                self.pos[k],self.pos[self.t[p*2]]=2*p,p
                self.t[p],self.t[2*p]=self.t[2*p],self.t[p]
            else:
                self.pos[k],self.pos[self.t[p*2+1]]=2*p+1,p
                self.t[p],self.t[2*p+1]=self.t[2*p+1],self.t[p]
            self.__sink__(k)
    def modifie(self,k,v):
        vv=self.val[k]
        self.val[k]=v
        if v<vv:
            self.__swim__(k)
        elif v>vv:
            self.__sink__(k)
    def affiche(self):
        print(self.t)
        print(self.val)
        
            
                                            
                                            
    

In [17]:
f=FileP()

In [18]:
f.affiche()

[0]
{}


In [19]:
f.entasse('a',3)

In [20]:
f.entasse('b',1)
f.affiche()

[2, 'b', 'a']
{'a': 3, 'b': 1}


In [21]:
f.entasse('c',5)
f.affiche()
f.entasse('d',0)
f.affiche()
f.entasse('e',3)
f.affiche()

[3, 'b', 'a', 'c']
{'a': 3, 'b': 1, 'c': 5}
[4, 'd', 'b', 'c', 'a']
{'a': 3, 'b': 1, 'c': 5, 'd': 0}
[5, 'd', 'b', 'c', 'a', 'e']
{'a': 3, 'b': 1, 'c': 5, 'd': 0, 'e': 3}


In [22]:
f.modifie('d',10)
f.affiche()

[5, 'b', 'e', 'c', 'a', 'd']
{'a': 3, 'b': 1, 'c': 5, 'd': 10, 'e': 3}


In [23]:
f.modifie('a',0)
f.affiche()

[5, 'a', 'b', 'c', 'e', 'd']
{'a': 0, 'b': 1, 'c': 5, 'd': 10, 'e': 3}


In [24]:
f.extrait()

('a', 0)

In [25]:
f.affiche()

[4, 'b', 'e', 'c', 'd']
{'b': 1, 'c': 5, 'd': 10, 'e': 3}


## La structure union-find

Le TAD union-find permet d'implémenter eficacement la recherche des **composantes connexes** d'un graphe, mais aussi l'algorithme de **Kruskal** de recherche d'un arbre couvrant minimal.

Un union-find est une partition d'un ensemble (de sommets d'un graphe, p.ex).

Ses primitives sont :
* créer un union-find vide
* rajouter un élément isolé 
* réunir (**union**) deux éléments de la partition
* chercher (**find**) l'élement de la partition dans lequel se trouve un élément de l'ensemble de base

Une implémentation astucieuse de la structue permet d'obtenir une **complexité constante** en pratique.