# Cours 4 : tris

Un algorithme de **tri** répond au problème suivant :



Lorsqu'un algorithme est proposé, on se pose les questions suivantes :

* l'algorithme fonctionne-t-il, pourquoi ? Comment le prouver ?
* Quelle est la complexité en temps de l'algorithme ? Dans le meilleur des cas ? Dans le pire des cas ? En moyenne ?
* Quelle est la complexité en espace de l'algorithme ?
* Le tri est-il effectué "sur place", c'est-à-dire à l'intérieur du tableau ?
* Le tri est-il "stable", c'est-à-dire est-ce qu'on modifie l'ordre des valeurs égales dans le tableau ?

## Mise en situation

Beaucoup d'entre vous ont déjà vu ou entrevu des algorithmes de tris. Nous allons donc commencer par écrire des algorithmes de la façon qui vous semble la plus naturelle et voir ce que l'on peut dire à partir des questions ci-dessus.

In [3]:
from random import randint
t = [randint(1,100) for i in range(100)]
print(t)

In [1]:
Tableaux_tests = [
    [5,4,3,2,1],
    [1,2,3,4,5],
    [6, 14, 2, 7, 10, 7, 11, 11, 17, 19, 5, 8, 9, 2, 14, 19, 13, 6, 1, 15],
    [100, 44, 84, 5, 99, 6, 26, 97, 39, 35, 50, 39, 22, 21, 81, 25, 30, 20, 45, 49, 33, 24, 38, 85, 32, 56, 7, 64, 18, 98, 62, 77, 91, 32, 4, 10, 96, 98, 73, 28, 27, 19, 22, 51, 52, 96, 87, 40, 19, 35, 55, 14, 91, 6, 67, 7, 60, 59, 86, 10, 41, 6, 88, 74, 76, 74, 48, 64, 69, 61, 26, 80, 3, 56, 35, 76, 84, 12, 13, 36, 78, 97, 19, 99, 39, 69, 75, 18, 24, 4, 2, 78, 15, 80, 50, 17, 99, 36, 63, 24],
    [72, 72, 75, 94, 42, 70, 63, 97, 7, 26, 79, 72, 12, 9, 12, 48, 75, 33, 78, 14, 44, 2, 19, 19, 11, 94, 72, 4, 14, 22, 69, 45, 8, 19, 99, 91, 48, 4, 9, 75, 8, 47, 19, 14, 98, 35, 95, 57, 5, 23, 80, 8, 37, 22, 61, 4, 49, 51, 62, 71, 48, 55, 5, 46, 10, 59, 25, 85, 7, 5, 63, 95, 97, 34, 24, 1, 11, 31, 21, 72, 11, 44, 56, 64, 12, 29, 53, 60, 92, 74, 99, 62, 56, 5, 16, 57, 100, 39, 68, 27]
]

In [3]:
def testTri(algo):
    """
    Lance une série de tests sur un algorithme donné 
    Input :
        - algo, un algorithme qui prend en paramètre un tableau et soit trie le tableau sur place, soit renvoie
        une version triée du tableau
    """
    non_trie = []
    
    surplace = 0
    for t in Tableaux_tests:
        tcopie = list(t) # on effectue une copie pour le test
        t2 = algo(tcopie)
        if t2 is None:
            surplace+=1
            t2 = tcopie
        if not sorted(t) == t2: # on compare au tri effectué par python
            non_trie.append(t)
        
    if len(non_trie) == 0:
        print("L'algoritme a trié tous les tableaux.")
        if surplace == len(Tableaux_tests):
            print("Le tri se fait sur place")
        else:
            print("Le tri ne se fait pas sur place")
    else:
        for t in non_trie:
            print("Le tri n'a pas fonctionné pour : ", t)
            
    
    

Ecrivez ci-dessous un algortihme de tri

In [4]:
def monTri(tab): # remarque : stable
    for i in range(len(tab)):
        for j in range(i,len(tab)):
            if(tab[i] > tab[j]):
                temp = tab[i]
                tab[i] = tab[j]
                tab[j] = temp

In [17]:
testTri(monTri)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


In [23]:
def monTriAffiche(tab):
    print(tab)
    for i in range(len(tab)):
        print(i)
        for j in range(i,len(tab)):
            if(tab[i] > tab[j]):
                temp = tab[i]
                tab[i] = tab[j]
                tab[j] = temp
                print(tab)
        print("fin de boucle")

In [24]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
monTriAffiche(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
0
[3, 9, 6, 1, 2, 4, 3, 5, 6, 4]
[1, 9, 6, 3, 2, 4, 3, 5, 6, 4]
fin de boucle
1
[1, 6, 9, 3, 2, 4, 3, 5, 6, 4]
[1, 3, 9, 6, 2, 4, 3, 5, 6, 4]
[1, 2, 9, 6, 3, 4, 3, 5, 6, 4]
fin de boucle
2
[1, 2, 6, 9, 3, 4, 3, 5, 6, 4]
[1, 2, 3, 9, 6, 4, 3, 5, 6, 4]
fin de boucle
3
[1, 2, 3, 6, 9, 4, 3, 5, 6, 4]
[1, 2, 3, 4, 9, 6, 3, 5, 6, 4]
[1, 2, 3, 3, 9, 6, 4, 5, 6, 4]
fin de boucle
4
[1, 2, 3, 3, 6, 9, 4, 5, 6, 4]
[1, 2, 3, 3, 4, 9, 6, 5, 6, 4]
fin de boucle
5
[1, 2, 3, 3, 4, 6, 9, 5, 6, 4]
[1, 2, 3, 3, 4, 5, 9, 6, 6, 4]
[1, 2, 3, 3, 4, 4, 9, 6, 6, 5]
fin de boucle
6
[1, 2, 3, 3, 4, 4, 6, 9, 6, 5]
[1, 2, 3, 3, 4, 4, 5, 9, 6, 6]
fin de boucle
7
[1, 2, 3, 3, 4, 4, 5, 6, 9, 6]
fin de boucle
8
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
fin de boucle
9
fin de boucle


In [20]:
def monTriCheck(tab):
    tab2 = sorted(tab) # tableau trié pour comparaison
    for i in range(len(tab)):
        for j in range(i,len(tab)):
            if(tab[i] > tab[j]):
                temp = tab[i]
                tab[i] = tab[j]
                tab[j] = temp
        assert(tab[:i+1] == tab2[:i+1]) # invariant de boucle

In [21]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
monTriCheck(t)

In [22]:
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

**Pourquoi ça fonctionne ?**

A chaque itération, on place e minimum au début de la partie "non triée"

Invariariant de boucle : le tableau jusqu'à i correspond au tableau trié 

**Quelle complexité ?**

Complexité $O(n^2)$ dans tous les cas

(Exemple d'un tri par sélection)

In [6]:
def tri_bulle(t):
    trier = False
    while(not trier):
        trier=True
        for i in range(0,len(t)-1):
            if(t[i]>t[i+1]):
                tmp=t[i+1]
                t[i+1]=t[i]
                t[i]=tmp
                trier=False

In [7]:
testTri(tri_bulle)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


In [26]:
def tri_bulleAffiche(t):
    print(t)
    trier = False
    while(not trier):
        trier=True
        for i in range(0,len(t)-1):
            if(t[i]>t[i+1]):
                tmp=t[i+1]
                t[i+1]=t[i]
                t[i]=tmp
                print(t)
                trier=False
        print("fin de boucle")

In [27]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
tri_bulleAffiche(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[3, 9, 6, 1, 2, 4, 3, 5, 6, 4]
[3, 6, 9, 1, 2, 4, 3, 5, 6, 4]
[3, 6, 1, 9, 2, 4, 3, 5, 6, 4]
[3, 6, 1, 2, 9, 4, 3, 5, 6, 4]
[3, 6, 1, 2, 4, 9, 3, 5, 6, 4]
[3, 6, 1, 2, 4, 3, 9, 5, 6, 4]
[3, 6, 1, 2, 4, 3, 5, 9, 6, 4]
[3, 6, 1, 2, 4, 3, 5, 6, 9, 4]
[3, 6, 1, 2, 4, 3, 5, 6, 4, 9]
fin de boucle
[3, 1, 6, 2, 4, 3, 5, 6, 4, 9]
[3, 1, 2, 6, 4, 3, 5, 6, 4, 9]
[3, 1, 2, 4, 6, 3, 5, 6, 4, 9]
[3, 1, 2, 4, 3, 6, 5, 6, 4, 9]
[3, 1, 2, 4, 3, 5, 6, 6, 4, 9]
[3, 1, 2, 4, 3, 5, 6, 4, 6, 9]
fin de boucle
[1, 3, 2, 4, 3, 5, 6, 4, 6, 9]
[1, 2, 3, 4, 3, 5, 6, 4, 6, 9]
[1, 2, 3, 3, 4, 5, 6, 4, 6, 9]
[1, 2, 3, 3, 4, 5, 4, 6, 6, 9]
fin de boucle
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
fin de boucle
fin de boucle


In [29]:
t = [6,5,4,3,2,1]
tri_bulleAffiche(t)

[6, 5, 4, 3, 2, 1]
[5, 6, 4, 3, 2, 1]
[5, 4, 6, 3, 2, 1]
[5, 4, 3, 6, 2, 1]
[5, 4, 3, 2, 6, 1]
[5, 4, 3, 2, 1, 6]
fin de boucle
[4, 5, 3, 2, 1, 6]
[4, 3, 5, 2, 1, 6]
[4, 3, 2, 5, 1, 6]
[4, 3, 2, 1, 5, 6]
fin de boucle
[3, 4, 2, 1, 5, 6]
[3, 2, 4, 1, 5, 6]
[3, 2, 1, 4, 5, 6]
fin de boucle
[2, 3, 1, 4, 5, 6]
[2, 1, 3, 4, 5, 6]
fin de boucle
[1, 2, 3, 4, 5, 6]
fin de boucle
fin de boucle


In [30]:
t = [2,3,4,5,1]
tri_bulleAffiche(t)

[2, 3, 4, 5, 1]
[2, 3, 4, 1, 5]
fin de boucle
[2, 3, 1, 4, 5]
fin de boucle
[2, 1, 3, 4, 5]
fin de boucle
[1, 2, 3, 4, 5]
fin de boucle
fin de boucle


**Comment ca marche ?** Déplace les grandes valeurs vers la fin.
On voit facilement que le résultat final est trié (test de la boucle while). Et le nombre d'inversions est réduit à chaque passage de boucle.

**quelle complexité ?**

Si tableau déjà trié : complexité $O(n)$

Si le tableau est décroissant "inversement trié", on est dans le pire des cas, complexité : $O(n^2)$ car $n$ passage de la boucle.

(exemple d'implantation d'un tri bulle)

In [31]:
def select_sort(array) :
    length = len(array)
    if length > 0 :
        for i in range(len(array)) :
            min = array[i]
            min_index = i
            for j in range(i, length) :
                if array[j] < min :
                    min = array[j]
                    min_index = j
            array[min_index] = array[i]
            array[i] = min

In [32]:
testTri(select_sort)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


In [33]:
def select_sortAffiche(array) :
    print(array)
    length = len(array)
    if length > 0 :
        for i in range(len(array)) :
            min = array[i]
            min_index = i
            for j in range(i, length) :
                if array[j] < min :
                    min = array[j]
                    min_index = j
            array[min_index] = array[i]
            array[i] = min
            print(array)

In [34]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
select_sortAffiche(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[1, 3, 6, 9, 2, 4, 3, 5, 6, 4]
[1, 2, 6, 9, 3, 4, 3, 5, 6, 4]
[1, 2, 3, 9, 6, 4, 3, 5, 6, 4]
[1, 2, 3, 3, 6, 4, 9, 5, 6, 4]
[1, 2, 3, 3, 4, 6, 9, 5, 6, 4]
[1, 2, 3, 3, 4, 4, 9, 5, 6, 6]
[1, 2, 3, 3, 4, 4, 5, 9, 6, 6]
[1, 2, 3, 3, 4, 4, 5, 6, 9, 6]
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]


Autre implantation du tri par sélection
Complexité $O(n^2)$ dans tous les cas

In [15]:
def tri(tab):
    valTemp = 0;
    for i in range(len(tab)):
        for j in range(i,len(tab)):
            if(tab[j] < tab[i]):
                valTemp = tab[i]
                tab[i] = tab[j]
                tab[j] = valTemp

In [16]:
testTri(tri)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


Encore un tri par sélection

## 3 algorithmes classiques mais inefficaces

### Un tri facile à écrire mais pas efficace : le tri par sélection

In [46]:
def triSelection(t):
    
    for fin in range(len(t), 0, -1): # on décrémente un indice depuis la fin du tableau
        imax = 0
        # on cherche l'indice de l'élément maximum
        for i in range(fin):
            if t[i] >= t[imax]: # stable si >=
                imax = i
        # on place l'élément maximal à la fin du tableau
        t[imax], t[fin-1] = t[fin-1], t[imax]
        

In [36]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]

In [37]:
triSelection(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

In [38]:
testTri(triSelection)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


**Pourquoi ça fonctionne ?**

In [48]:
def triSelectionAffichage(t):
    print(t)
    
    for fin in range(len(t), 0, -1): # on décrémente un indice depuis la fin du tableau
        imax = 0
        # on cherche l'indice de l'élément maximum
        for i in range(fin):
            if t[i] >= t[imax]:
                imax = i
        # on place l'élément maximal à la fin du tableau
        t[imax], t[fin-1] = t[fin-1], t[imax]
        print(t)

In [40]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triSelectionAffichage(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[4, 3, 6, 1, 2, 4, 3, 5, 6, 9]
[4, 3, 6, 1, 2, 4, 3, 5, 6, 9]
[4, 3, 5, 1, 2, 4, 3, 6, 6, 9]
[4, 3, 3, 1, 2, 4, 5, 6, 6, 9]
[4, 3, 3, 1, 2, 4, 5, 6, 6, 9]
[2, 3, 3, 1, 4, 4, 5, 6, 6, 9]
[2, 1, 3, 3, 4, 4, 5, 6, 6, 9]
[2, 1, 3, 3, 4, 4, 5, 6, 6, 9]
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]


In [49]:
t = [1,2,3,2,3,1,1,1]
triSelectionAffichage(t)

[1, 2, 3, 2, 3, 1, 1, 1]
[1, 2, 3, 2, 1, 1, 1, 3]
[1, 2, 1, 2, 1, 1, 3, 3]
[1, 2, 1, 1, 1, 2, 3, 3]
[1, 1, 1, 1, 2, 2, 3, 3]
[1, 1, 1, 1, 2, 2, 3, 3]
[1, 1, 1, 1, 2, 2, 3, 3]
[1, 1, 1, 1, 2, 2, 3, 3]
[1, 1, 1, 1, 2, 2, 3, 3]


A la fin de chaque itération de boucle, qu'est-ce qui est vrai ? Pourquoi le tableau est-il "plus trié" ?

La fin du tableau est triée

Peut-on le vérfier automatiquement ?

In [43]:
def triSelectionCheck(t):
    # Rajouter un assert à chaque itération pour vérifier l'invariant de boucle
    tsorted = sorted(t) # la version triee par python pour "vérfier"
    
    for fin in range(len(t), 0, -1): # on décrémente un indice depuis la fin du tableau
        imax = 0
        # on cherche l'indice de l'élément maximum
        for i in range(fin):
            if t[i] > t[imax]:
                imax = i
        # on place l'élément maximal à la fin du tableau
        t[imax], t[fin-1] = t[fin-1], t[imax]
        assert(tsorted[fin-1:] == t[fin-1:])
    


In [44]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triSelectionCheck(t)

**Quelle est la complexité de l'algorithme ?**

Dans le meilleur des cas ? 

Dans le pire des cas ?

En moyenne ?

$O(n^2)$ dans tous les cas.

**Quelle est la complexité en espace de l'algorithme ?** $O(1)$ = on a pas besoin d'espace supplémentaire en plus du tableau de départ

**Le tri est-il effectué sur place ?** oui

**Le tri est-il stable ?** Oui si on l'écrit pour. (Attention, la première version du cours ne l'était pas !)

**Conclusion sur le tri sélection**

Un tri peu efficace et jamais utilisé en pratique.

Avantages :

* facile à implater
* faible nombre d'écriture dans le tableau (cf TP)
* Tri sur place et stable (si bien écrit)

Inconvénient :

* Forte complexité quelque soit les données

### Un tri amusant mais toujours inefficace : le tri bulle





In [50]:
def triBulle(t):
    for fin in range(len(t),0,-1): # on décrémente un indice depuis la fin du tableau
        inversions = False
        for i in range(fin-1):
            # les grands éléments avancent vers la fin comme des "bulles"
            if t[i] > t[i+1]:
                t[i],t[i+1] = t[i+1],t[i]
                inversions = True
        if not inversions:
            return

In [51]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triBulle(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

In [52]:
testTri(triBulle)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


**Pourquoi ça fonctionne ?**

In [53]:
def triBulleAffichage(t):
    print(t)
    for fin in range(len(t),0,-1): # on décrémente un indice depuis la fin du tableau
        inversions = False
        for i in range(fin-1):
            # les grands éléments avancent vers la fin comme des "bulles"
            if t[i] > t[i+1]:
                t[i],t[i+1] = t[i+1],t[i]
                print(t)
                inversions = True
        print("fin de boucle")
        if not inversions:
            return

In [54]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triBulleAffichage(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[3, 9, 6, 1, 2, 4, 3, 5, 6, 4]
[3, 6, 9, 1, 2, 4, 3, 5, 6, 4]
[3, 6, 1, 9, 2, 4, 3, 5, 6, 4]
[3, 6, 1, 2, 9, 4, 3, 5, 6, 4]
[3, 6, 1, 2, 4, 9, 3, 5, 6, 4]
[3, 6, 1, 2, 4, 3, 9, 5, 6, 4]
[3, 6, 1, 2, 4, 3, 5, 9, 6, 4]
[3, 6, 1, 2, 4, 3, 5, 6, 9, 4]
[3, 6, 1, 2, 4, 3, 5, 6, 4, 9]
fin de boucle
[3, 1, 6, 2, 4, 3, 5, 6, 4, 9]
[3, 1, 2, 6, 4, 3, 5, 6, 4, 9]
[3, 1, 2, 4, 6, 3, 5, 6, 4, 9]
[3, 1, 2, 4, 3, 6, 5, 6, 4, 9]
[3, 1, 2, 4, 3, 5, 6, 6, 4, 9]
[3, 1, 2, 4, 3, 5, 6, 4, 6, 9]
fin de boucle
[1, 3, 2, 4, 3, 5, 6, 4, 6, 9]
[1, 2, 3, 4, 3, 5, 6, 4, 6, 9]
[1, 2, 3, 3, 4, 5, 6, 4, 6, 9]
[1, 2, 3, 3, 4, 5, 4, 6, 6, 9]
fin de boucle
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
fin de boucle
fin de boucle


Quel invariant de boucle peut-on définir ?

La fin du tableau est triée.

Le nombre d'inversions diminue.

.

.

In [55]:
def triBulleCheck(t):
    # Tri avec vérification de l'invariant de boucle
    tsorted = sorted(t)
    for fin in range(len(t),0,-1): # on décrémente un indice depuis la fin du tableau
        inversions = False
        for i in range(fin-1):
            # les grands éléments avancent vers la fin comme des "bulles"
            if t[i] > t[i+1]:
                t[i],t[i+1] = t[i+1],t[i]
                inversions = True
        assert(tsorted[fin-1:] == t[fin-1:])
        if not inversions:
            return


In [56]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triBulleCheck(t)

In [37]:
t

In [57]:
# Un autre invariant possible
def nbInversions(t):
    return sum(sum(1 for v in t[i+1:] if v <t[i]) for i in range(len(t)))

In [58]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
nbInversions(t)

20

In [59]:
def triBulleCheck2(t):
    # Tri avec vérification de l'invariant par comptage des inversions
    nb = nbInversions(t)
    
    for fin in range(len(t),0,-1): # on décrémente un indice depuis la fin du tableau
        inversions = False
        for i in range(fin-1):
            # les grands éléments avancent vers la fin comme des "bulles"
            if t[i] > t[i+1]:
                t[i],t[i+1] = t[i+1],t[i]
                inversions = True
        if not inversions:
            return
        else:
            new_nb = nbInversions(t)
            assert new_nb < nb
            nb = new_nb

In [60]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triBulleCheck2(t)

**Quelle est la complexité de l'algorithme ?**

Dans le meilleur des cas ? $O(n)$

Dans le pire des cas ? $O(n^2)$

En moyenne ?


Pour répondre, il faut calculer le nombre d'inversions moyen d'un "tableau aléatoire". Pour simplifier, on supposera que toutes les valeurs sont distinctes et que le tableau correspond à une permutation aléatoire choisie uniformément parmi les permutations d'un certain ensemble.

Soit $i$ et $j$, avec $i < j$, deux indices du tableau, la probabilité de $tab[i] < tab[j]$ est $\frac{1}{2}$ car pour deux valeurs $v$ et $w$, le nombre de tableaux tel que $t[i] = v$ et $t[j] = w$ est le même que le nombre de tableau tel que $t[i] = w$ et $t[j] = w$. Il existe donc $\frac{n(n-1)}{2}$ couples $i < j$ et chacun a une probabilité $\frac{1}{2}$ d'être une inversion. Par linéarité de l'espérance, on obtient donc que le nombre d'inversions est en moyenne de $I = \frac{n(n-1)}{4}$, et comme on sait que $I \leq C$, on en conclue que la **complexité en moyenne est toujours de $O(n^2)$**

Mais attention ! La complexité du tri bulle est supérieure au nombre d'inversion !

Par exemple, dans le cas du tableau `[2,3,4,5,1]` : on a 4 inversions (les 4 nombres 2 3 4 5 avec 1) mais pourtant on va être dans le "pire des cas" c'est-à-dire $5+4+3+2$ opérations -- beaucoup de comparaisons inutiles. 

**Quelle est la complexité en espace de l'algorithme ?** $O(1)$

**Le tri est-il effectué sur place ?** Oui

**Le tri est-il stable ?** Oui

**Conclusion pour le tri bulle**

Un tri inefficace et jamais utilisé en pratique.

Avantages :

* Implantation simple
* Tri sur place et stable
* Complexité linéaire dans le meilleur des cas

Inconvénients :

* Complexité quadratique dans le pire des cas et en moyenne
* Une seule valeur mal placée peut amener à une complexité quadratique


### Un tri intéressant : le tri par insertion

In [62]:
def triInsertion(t):
    # on va insérer les valeurs une à une dans le début (trié du tableau)
    for i in range(1, len(t)): # l'indice de la valeur à insérer
        v = t[i]
        j = i-1
        while j >= 0 and t[j] > v: # on décale les valeurs plus grandes que v
            t[j+1] = t[j]
            j-=1
        t[j+1] = v # on place v à sa position dans cette partie du tableau

In [63]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triInsertion(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

In [64]:
testTri(triInsertion)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


**Pourquoi ça fonctionne ?**

In [75]:
def triInsertionAffichage(t):
    print(t)
    # on va insérer les valeurs une à une dans le début (trié du tableau)
    for i in range(1, len(t)): # l'indice de la valeur à insérer
        v = t[i]
        j = i-1
        while j >= 0 and t[j] > v: # on décale les valeurs plus grandes que v
            t[j+1] = t[j]
            print(t)
            j-=1
        t[j+1] = v # on place v à sa position dans cette partie du tableau
        print(t)
        print("Fin de boucle")

In [76]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triInsertionAffichage(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[9, 9, 6, 1, 2, 4, 3, 5, 6, 4]
[3, 9, 6, 1, 2, 4, 3, 5, 6, 4]
Fin de boucle
[3, 9, 9, 1, 2, 4, 3, 5, 6, 4]
[3, 6, 9, 1, 2, 4, 3, 5, 6, 4]
Fin de boucle
[3, 6, 9, 9, 2, 4, 3, 5, 6, 4]
[3, 6, 6, 9, 2, 4, 3, 5, 6, 4]
[3, 3, 6, 9, 2, 4, 3, 5, 6, 4]
[1, 3, 6, 9, 2, 4, 3, 5, 6, 4]
Fin de boucle
[1, 3, 6, 9, 9, 4, 3, 5, 6, 4]
[1, 3, 6, 6, 9, 4, 3, 5, 6, 4]
[1, 3, 3, 6, 9, 4, 3, 5, 6, 4]
[1, 2, 3, 6, 9, 4, 3, 5, 6, 4]
Fin de boucle
[1, 2, 3, 6, 9, 9, 3, 5, 6, 4]
[1, 2, 3, 6, 6, 9, 3, 5, 6, 4]
[1, 2, 3, 4, 6, 9, 3, 5, 6, 4]
Fin de boucle
[1, 2, 3, 4, 6, 9, 9, 5, 6, 4]
[1, 2, 3, 4, 6, 6, 9, 5, 6, 4]
[1, 2, 3, 4, 4, 6, 9, 5, 6, 4]
[1, 2, 3, 3, 4, 6, 9, 5, 6, 4]
Fin de boucle
[1, 2, 3, 3, 4, 6, 9, 9, 6, 4]
[1, 2, 3, 3, 4, 6, 6, 9, 6, 4]
[1, 2, 3, 3, 4, 5, 6, 9, 6, 4]
Fin de boucle
[1, 2, 3, 3, 4, 5, 6, 9, 9, 4]
[1, 2, 3, 3, 4, 5, 6, 6, 9, 4]
Fin de boucle
[1, 2, 3, 3, 4, 5, 6, 6, 9, 9]
[1, 2, 3, 3, 4, 5, 6, 6, 6, 9]
[1, 2, 3, 3, 4, 5, 6, 6, 6, 9]
[1, 2, 3, 3, 4, 5, 5

In [77]:
t = [1,2,3,4,5] 
triInsertionAffichage(t)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]
Fin de boucle
[1, 2, 3, 4, 5]
Fin de boucle
[1, 2, 3, 4, 5]
Fin de boucle
[1, 2, 3, 4, 5]
Fin de boucle


In [78]:
t = [5,4,3,2,1]
triInsertionAffichage(t)

[5, 4, 3, 2, 1]
[5, 5, 3, 2, 1]
[4, 5, 3, 2, 1]
Fin de boucle
[4, 5, 5, 2, 1]
[4, 4, 5, 2, 1]
[3, 4, 5, 2, 1]
Fin de boucle
[3, 4, 5, 5, 1]
[3, 4, 4, 5, 1]
[3, 3, 4, 5, 1]
[2, 3, 4, 5, 1]
Fin de boucle
[2, 3, 4, 5, 5]
[2, 3, 4, 4, 5]
[2, 3, 3, 4, 5]
[2, 2, 3, 4, 5]
[1, 2, 3, 4, 5]
Fin de boucle


In [79]:
t = [2,3,4,5,1]
triInsertionAffichage(t)

[2, 3, 4, 5, 1]
[2, 3, 4, 5, 1]
Fin de boucle
[2, 3, 4, 5, 1]
Fin de boucle
[2, 3, 4, 5, 1]
Fin de boucle
[2, 3, 4, 5, 5]
[2, 3, 4, 4, 5]
[2, 3, 3, 4, 5]
[2, 2, 3, 4, 5]
[1, 2, 3, 4, 5]
Fin de boucle


Quel invariant de boucle peut-on définir ?

La première partie du tableau jusque $i$ triée.

.

.

.

In [73]:
def triInsertionCheck(t):
    # vérifier que le début du tableau est trié
    t2 = list(t) # copie du tableau pour effectuer les tests
    
    # on va insérer les valeurs une à une dans le début (trié du tableau)
    for i in range(1, len(t)): # l'indice de la valeur à insérer
        v = t[i]
        j = i-1
        while j >= 0 and t[j] > v: # on décale les valeurs plus grandes que v
            t[j+1] = t[j]
            j-=1
        t[j+1] = v # on place v à sa position dans cette partie du tableau
        assert(all(t[k] <= t[k+1]) for k in range(i))
        # quel que soit k < i, alors t[k] <= t[k+1]
        # assert(t[:i+1] == t2[:i+1]) # faux !! 
        # La première partie du tableau ne correspond pas à la première partie du tableau final
        assert(sorted(t2[:i+1]) == t[:i+1]) 
        # ce test vérifie que les valeurs triées snt bien celles du tableau initial


In [74]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triInsertionCheck(t)

In [53]:
t

**Quelle est la complexité de l'algorithme ?**

Dans le meilleur des cas ? $O(n)$

Dans le pire des cas ? $O(n^2)$

En moyenne ? $O(n^2)$

Le problème est assez similaires à celui du tri à bulles. En effet, à chaque insertion, on supprime un nombre d'inversion exactement égal au décalage que l'on fait subir au tableau trié. Observez par exemple l'insertion du nombre 2 dans l'exemple donné : on décale le 3, le 6 et le 9 et on supprime  les trois inversions de ces nombres avec le 2 lui-même (surtout, on en supprime pas plus). On en arrive donc à la même conclusion que pour le tri à bulle : en moyenne, il faudra au minimum $\frac{n(n-1)}{4}$ opérations, soit une **complexité en $O(n^2)$**.

Cependant, il est à noter que si l'on peut maîtriser le nombre d'inversions : par exemple en limitant la distance possible entre une valeur et sa position finale, on limite aussi à coup sûr le nombre d'opérations. En effet, en observant l'algorithme, on observe que le nombre de comparaisons est pratiquement égal au nombre d'inversions. Ainsi, si on exprime le problème, non plus seulement en fonction de $n$, mais en fonction de $n$ et $I$ où $I$ est le nombre d'inversions on trouve une complexité en $O(n +I)$. En particulier, si on travail sur des données dont le nombre d'inversions est en $O(n)$, alors on retrouve une complexité linéaire.

**Quelle est la complexité en espace de l'algorithme ?**

**Le tri est-il effectué sur place ?**

**Le tri est-il stable ?**


**Conclusion pour le tri insertion**

Un tri inefficace sur des données quelconque mais qui peut être très efficace sur des données "presque triées" (cf TP).

Avantages :

* Tri sur place et stable
* Complexité linéaire dans le meilleur des cas
* Complexité linéaire au nombre d'inversions

Inconvénients :

* Complexité quadratique dans le pire des cas et en moyenne

## Deux tris récursifs utilisant le principe du "diviser pour régner"

Le princie de *diviser pour régner* consiste à séparer le problème en deux problèmes plus petits de façon récursive. On voit ici deux algorithmes très classiques souvent à la base des algorithmes implantés "en vrai"

### Le tri rapide

A chaque étape, on choisit un pivot $p$ (ici la première valeur) et effectue un parcourt du tableau tel que toutes les valeurs $v \leq p$ soit au début du tableau et les autres à la fin. On place $p$ à la fin des petites valeurs, c'est-à-dire à son emplacement final dans le tableau trié. Puis on lance le tri récursivement sur les deux moitiés du tableau données par $p$.

Commençons par écrire la fonction *pivot* : 

**Attention !** La complexité doit être de $O(n)$. Plus précisément, on ne veut parcourir le tableau qu'une seule fois.

Indication : l'ordre des valeurs plus petites que le pivot n'a pas besoin d'être respecté. Parcourez le tableau en mettant "au début" les plus petites et "à la fin" les plus grandes en maintenant les indices nécessaires.

In [84]:
def pivot(t):
    # ecrire la fonction pivot
    if len(t) <= 1:
        return
    p = t[0]
    j = len(t)
    i = 1
    while i < j:
        if t[i] <= p:
            i+=1
        else:
            t[i],t[j-1] = t[j-1],t[i]
            j-=1
    t[0], t[j-1] = t[j-1], t[0]
    return j-1


In [90]:
def pivotCheck(t):
    # ecrire la fonction pivot
    if len(t) <= 1:
        return
    p = t[0]
    j = len(t)
    i = 1
    while i < j:
        if t[i] <= p:
            i+=1
        else:
            t[i],t[j-1] = t[j-1],t[i]
            j-=1
        assert all(t[k] <= p for k in range(i)) and all(t[k] > p for k in range(j,len(t)))
    t[0], t[j-1] = t[j-1], t[0]
    return j-1

In [None]:
# t = [5,1,2,4,3,    6  , ...., 3,    9, 7, 6,8] i = 5 j = indice de la valeur 9
# t = [5,1,2,4,3,    3  , ...., 6,    9, 7, 6,8] i = 5, j = indice de la valeur 6

In [85]:
t = [5, 7, 1, 3, 5, 4, 2, 2, 8]
pivot(t)

6

In [91]:
t = [5, 7, 1, 3, 5, 4, 2, 2, 8]
pivotCheck(t)

6

In [86]:
t

[2, 2, 1, 3, 5, 4, 5, 8, 7]

In [87]:
t[6]

5

In [92]:
t = [5, 7, 1, 3, 5, 4, 2, 2, 8]
sorted(t)

[1, 2, 2, 3, 4, 5, 5, 7, 8]

In [89]:
for t in Tableaux_tests:
    t = list(t)
    p = t[0]
    i = pivot(t)
    assert all(t[j] <= t[i] for j in range(i)) and all(t[j] > t[i] for j in range(i+1, len(t))) and t[i] == p

Une fois qu'on a la fonction pivot, le principe du tri est de l'utiliser pour découper notre tableau en deux parties sur lesqueles on lance de nouveau l'algorithme de façon récursive.

In [93]:
def triRapide1(t):
    if len(t) <= 1: # cas d'arret
        return t
    i = pivot(t) # on sépare les valeurs et on récupère l'indice "du milieu"
    return triRapide1(t[:i]) + [t[i]] + triRapide1(t[i+1:]) # l'appel récursif
        

In [94]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
t = triRapide1(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

In [101]:
def triRapide1Affiche(t):
    print(t)
    if len(t) <= 1: # cas d'arret
        return t
    i = pivot(t) # on sépare les valeurs et on récupère l'indice "du milieu"
    print(t)
    t2 = triRapide1Affiche(t[:i]) + [t[i]] + triRapide1Affiche(t[i+1:]) # l'appel récursif
    print("tableau trié : ", t2)
    return t2

In [102]:
testTri(triRapide1)

L'algoritme a trié tous les tableaux.
Le tri ne se fait pas sur place


In [103]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triRapide1Affiche(t)

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[4, 3, 6, 1, 2, 4, 3, 5, 6, 9]
[4, 3, 6, 1, 2, 4, 3, 5, 6]
[4, 3, 3, 1, 2, 4, 5, 6, 6]
[4, 3, 3, 1, 2]
[2, 3, 3, 1, 4]
[2, 3, 3, 1]
[1, 2, 3, 3]
[1]
[3, 3]
[3, 3]
[3]
[]
tableau trié :  [3, 3]
tableau trié :  [1, 2, 3, 3]
[]
tableau trié :  [1, 2, 3, 3, 4]
[5, 6, 6]
[5, 6, 6]
[]
[6, 6]
[6, 6]
[6]
[]
tableau trié :  [6, 6]
tableau trié :  [5, 6, 6]
tableau trié :  [1, 2, 3, 3, 4, 4, 5, 6, 6]
[]
tableau trié :  [1, 2, 3, 3, 4, 4, 5, 6, 6, 9]


[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

Tel qu'on l'a écrit, l'algorithme fait de recopie le tableau à chaque appel récursif, mais on peut corriger le problème. Voici une version "tout en un" ou le même tableau est passé en paramètre, dans ce cas, on doit aussi passer les bornes du tableau.

In [122]:
@compteAppels
def triRapideRec(t, deb, fin):
    if fin - deb <= 1: # condition d'arret (taille 0 ou 1)
        return
    # pivot
    p = t[deb]
    i = deb + 1
    j = fin
    while i < j:
        if t[i] <= p:
            i+=1
        else:
            j-= 1
            t[i],t[j] = t[j],t[i]
    i-=1
    t[deb],t[i] = t[i],t[deb]
    
    # appels récursifs
    triRapideRec(t,deb,i)
    triRapideRec(t, i+1, fin)

def triRapide2(t):
    triRapideRec(t, 0, len(t))

In [105]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triRapide2(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

In [106]:
testTri(triRapide2)

L'algoritme a trié tous les tableaux.
Le tri se fait sur place


**Pourquoi ça fonctionne ?**

Observons sur l'exemple précédent

In [115]:
import functools

COMPTEUR = 0
STACK = 0

def compteAppels(func):
    c = 0
    """Print the function signature and return value"""
    @functools.wraps(func)
    def wrapper_debug(*args, **kwargs):
        global COMPTEUR, STACK
        COMPTEUR +=1
        STACK += 1
        value = func(*args, **kwargs)
        STACK -=1
        if STACK == 0:
            print(f"{COMPTEUR} appels à la fonction {func.__name__}")
            COMPTEUR = 0
        return value
    return wrapper_debug

In [116]:
@compteAppels
def triRapideRecAffichage(t, deb, fin):
    print("Appel sur ", deb, fin)
    if fin - deb <= 1: # condition d'arret (taille 0 ou 1)
        return
    # pivot
    print(t)
    p = t[deb]
    i = deb + 1
    j = fin
    while i < j:
        if t[i] <= p:
            i+=1
        else:
            j-= 1
            t[i],t[j] = t[j],t[i]
    i-=1
    t[deb],t[i] = t[i],t[deb]
    print("pivot indice ", i)
    print(t)
    
    # appels récursifs
    triRapideRecAffichage(t,deb,i)
    triRapideRecAffichage(t, i+1, fin)

def triRapide2Affichage(t):
    triRapideRecAffichage(t, 0, len(t))

In [117]:
t = [1,2,3,4,5,6,7,8,9]
triRapide2Affichage(t)

Appel sur  0 9
[1, 2, 3, 4, 5, 6, 7, 8, 9]
pivot indice  0
[1, 3, 4, 5, 6, 7, 8, 9, 2]
Appel sur  0 0
Appel sur  1 9
[1, 3, 4, 5, 6, 7, 8, 9, 2]
pivot indice  2
[1, 2, 3, 6, 7, 8, 9, 5, 4]
Appel sur  1 2
Appel sur  3 9
[1, 2, 3, 6, 7, 8, 9, 5, 4]
pivot indice  5
[1, 2, 3, 5, 4, 6, 9, 8, 7]
Appel sur  3 5
[1, 2, 3, 5, 4, 6, 9, 8, 7]
pivot indice  4
[1, 2, 3, 4, 5, 6, 9, 8, 7]
Appel sur  3 4
Appel sur  5 5
Appel sur  6 9
[1, 2, 3, 4, 5, 6, 9, 8, 7]
pivot indice  8
[1, 2, 3, 4, 5, 6, 7, 8, 9]
Appel sur  6 8
[1, 2, 3, 4, 5, 6, 7, 8, 9]
pivot indice  6
[1, 2, 3, 4, 5, 6, 7, 8, 9]
Appel sur  6 6
Appel sur  7 8
Appel sur  9 9
13 appels à la fonction triRapideRecAffichage


In [118]:
t = [5,8,2,1,3,7,6,4,9]
triRapide2Affichage(t)

Appel sur  0 9
[5, 8, 2, 1, 3, 7, 6, 4, 9]
pivot indice  4
[3, 4, 2, 1, 5, 6, 7, 9, 8]
Appel sur  0 4
[3, 4, 2, 1, 5, 6, 7, 9, 8]
pivot indice  2
[2, 1, 3, 4, 5, 6, 7, 9, 8]
Appel sur  0 2
[2, 1, 3, 4, 5, 6, 7, 9, 8]
pivot indice  1
[1, 2, 3, 4, 5, 6, 7, 9, 8]
Appel sur  0 1
Appel sur  2 2
Appel sur  3 4
Appel sur  5 9
[1, 2, 3, 4, 5, 6, 7, 9, 8]
pivot indice  5
[1, 2, 3, 4, 5, 6, 9, 8, 7]
Appel sur  5 5
Appel sur  6 9
[1, 2, 3, 4, 5, 6, 9, 8, 7]
pivot indice  8
[1, 2, 3, 4, 5, 6, 7, 8, 9]
Appel sur  6 8
[1, 2, 3, 4, 5, 6, 7, 8, 9]
pivot indice  6
[1, 2, 3, 4, 5, 6, 7, 8, 9]
Appel sur  6 6
Appel sur  7 8
Appel sur  9 9
13 appels à la fonction triRapideRecAffichage


In [108]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triRapide2Affichage(t)

Appel sur  0 10
[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
pivot indice  9
[4, 3, 6, 1, 2, 4, 3, 5, 6, 9]
Appel sur  0 9
[4, 3, 6, 1, 2, 4, 3, 5, 6, 9]
pivot indice  5
[4, 3, 3, 1, 2, 4, 5, 6, 6, 9]
Appel sur  0 5
[4, 3, 3, 1, 2, 4, 5, 6, 6, 9]
pivot indice  4
[2, 3, 3, 1, 4, 4, 5, 6, 6, 9]
Appel sur  0 4
[2, 3, 3, 1, 4, 4, 5, 6, 6, 9]
pivot indice  1
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
Appel sur  0 1
Appel sur  2 4
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
pivot indice  3
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
Appel sur  2 3
Appel sur  4 4
Appel sur  5 5
Appel sur  6 9
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
pivot indice  6
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
Appel sur  6 6
Appel sur  7 9
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
pivot indice  8
[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]
Appel sur  7 8
Appel sur  9 9
Appel sur  10 10


In [123]:
t = list(range(1000))
triRapide2(t)

1887 appels à la fonction triRapideRec


In [124]:
from random import randint
t = [randint(1,1000) for i in range(1000)]
triRapide2(t)

1359 appels à la fonction triRapideRec


Comment prouver que ça marche ?

C'est une prevue par récurrence. 

Cas de base : taille <= 1 : ok

Invariant (a): le pivot est bien placé à la fin de l'algo
Ce qui est avant -- après : tableau structement plus petit et donc trié récursivement

Comment prouver que le pivot fonctionne ?

Qu'est-ce qui est vrai à la fin de chaque itération de boucle dans le pivot ? 

Invariant (b) dans le pivot : tout ce qui est avant l'indice i est plus petit et tout ce qui est après j est plus grand.



In [109]:
def triRapideRecCheck(t, deb, fin):
    if fin - deb <= 1: # condition d'arret (taille 0 ou 1)
        return
    # pivot
    p = t[deb]
    i = deb + 1
    j = fin
    while i < j:
        if t[i] <= p:
            i+=1
        else:
            j-= 1
            t[i],t[j] = t[j],t[i]
        # invariant (b)
        assert all(t[k] <= p for k in range(deb,i)) and all(t[k] > p for k in range(j,fin))
    i-=1
    t[deb],t[i] = t[i],t[deb]
    assert t[i] == sorted(t)[i] # le pivot est placé à son emplacement final -- invariant (a)
    
    # appels récursifs
    triRapideRecCheck(t,deb,i)
    triRapideRecCheck(t, i+1, fin)

def triRapide2Check(t):
    triRapideRecCheck(t, 0, len(t))

In [110]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triRapide2Check(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

**Quelle est la complexité de l'algorithme ?**

A chaque étape, le tableau est divisé en deux sous-tableaux. La taille de ces sous-tableaux n'est pas constante, elle dépend du pivot. Si l'on choisit un tableau strictement décroissant ou croissant, à chaque étape $n$, il sera décomposé en un tableau de taille $O$ et un tableau de taille $n-1$. Soit $f$ la complexité de mon tri, on obtient la formule récursive

$\begin{align}
f(1) &= 1 \\
f(n) &= n + f(n-1).
\end{align}$

En dé-récursivant : $f$ est la somme des entiers de 1 à $n$. On a une **complexité quadratique** soit $O(n^2)$.

**ATTENTION : pire des cas = cas du tableau trié**

Le cas où le **tableau est trié** dans un sens ou dans l'autre est donc **le pire des cas** pour le tri rapide. Quel est le meilleur des cas ? Celui où le tableau est divisé en deux sous-parties de tailles équivalentes. Prenons par exemple la fonction récursive suivante

$\begin{align}
f( n \leq 1) &= 1 \\
f(n) &= n + 2 f \left(\frac{n}{2} \right) \\
     &= n + 2 \left( \frac{n}{2} + 2 \left( \frac{n}{ 4} + \dots \right) \right)
\end{align}$

En développant, les fractions se simplifient et on obtient $f(n) = n(\log(n) + 1)$, c'est-à-dire une complexité en $O(n \log(n))$. Donc la complexité du tri rapide est améliorée si on divise le tableau en parts égales.

On peut utiliser cette propriété pour le calcul de la complexité en moyenne. Sans entrer dans les détails du calcul, si le tableau est une permutation aléatoire d'un certain ensemble, le choix du pivot le divisera en sous-parties qui seront équilibrées en moyenne et elles-mêmes des permutations aléatoires. Par une étude probabiliste et des calculs un peu plus poussés, on obtient que **la complexité en moyenne est en $O(n \log(n))$**.

**Quelle est la complexité en espace de l'algorithme ?** $O(1)$

**Le tri est-il effectué sur place ?** Oui

**Le tri est-il stable ?** Non

**Conclusion sur le tri rapide**

Tri considéré comme très efficace en pratique et donc souvent utilisé. Cependant, **attention** car la complexité du pire des cas reste quadratique !

**Avantages**

* Tri en place
* Complexité $O(n \log(n))$ en moyenne
* Bonne efficacité en pratique

**Inconvénients**

* Complexité quadratique dans le pire des cas (et sur le tableau trié)
* Peu efficace sur des données "presque triées"

### Le tri fusion

Là encore, on va utiliser le principe du *diviser pour régner*. L'idée est la suivante : si mon tableau est de taille 0 ou 1 alors, il est trié. S'il est plus grand, je peux le diviser en deux moitiés égales et les trier séparément. Mon problème est donc maintenant le suivant : **comment fusionner deux tableaux trier en un seul ?**

Implantez la fonction suivante. On veut une complexité **linéaire** chacun des tableaux `t1` et `t2` ne doit être parcouru d'une seule fois.

In [128]:
def fusion(t1, t2):
    """
    Input : t1 et t2 deux tableaux déjà trié
    Output : un nouveau tableau t contenant les valeurs triées de t1 et t2
    """
    i1=0
    i2=0
    t=[]
    i=0
    while i1<len(t1) or i2<len(t2):
        if i1 >= len(t1):
            t.append(t2[i2])
            i2+=1
        elif i2 >= len(t2):
            t.append(t1[i1])
            i1+=1
        else:
            if(t1[i1]<t2[i2]):
                t.append(t1[i1])
                i1+=1
            else:
                t.append(t2[i2])
                i2+=1
    return t
    
        

In [129]:
t1 = [1,1,5,6,8,9]
t2 = [2,3,5,8]
fusion(t1,t2)

[1, 1, 2, 3, 5, 5, 6, 8, 8, 9]

In [130]:
t1 = [2, 2, 3, 4, 4, 6, 6, 7, 8, 8, 9, 10, 11, 12, 12, 12, 15, 15, 15, 18]
t2 = [6, 6, 8, 9, 9, 9, 9, 10, 10, 10, 11, 12, 12, 13, 14, 18, 18, 18, 19, 20]
assert fusion(t1,t2) == sorted(t1 + t2)

On peut maintenant écrire de façon très simple le tri fusion

In [131]:
def triFusion(t):
    if len(t) <= 1: # cas d'arret
        return t
    m = len(t)//2 # la moitié du tableau
    return fusion(triFusion(t[:m]), triFusion(t[m:]))

In [132]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
t = triFusion(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

In [133]:
testTri(triFusion)

L'algoritme a trié tous les tableaux.
Le tri ne se fait pas sur place


**Pourquoi ça fonctionne ?**

In [134]:
def fusionAffiche(t1, t2):
    """
    Input : t1 et t2 deux tableaux déjà trié
    Output : un nouveau tableau t contenant les valeurs triées de t1 et t2
    """
    print("Fusion de ", t1, t2)
    i = 0
    j = 0
    t = []
    while i < len(t1) and j < len(t2):
        if t1[i] <= t2[j]:
            t.append(t1[i])
            i+=1
        else:
            t.append(t2[j])
            j+=1
    if i < len(t1):
        t.extend(t1[i:])
    if j < len(t2):
        t.extend(t2[j:])
    print("Résultat fusion :", t)
    return t

def triFusionAffiche(t):
    print(t)
    if len(t) <= 1: # cas d'arret
        return t
    m = len(t)//2 # la moitié du tableau
    return fusionAffiche(triFusionAffiche(t[:m]), triFusionAffiche(t[m:]))


In [135]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
t = triFusionAffiche(t)
t

[9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
[9, 3, 6, 1, 2]
[9, 3]
[9]
[3]
Fusion de  [9] [3]
Résultat fusion : [3, 9]
[6, 1, 2]
[6]
[1, 2]
[1]
[2]
Fusion de  [1] [2]
Résultat fusion : [1, 2]
Fusion de  [6] [1, 2]
Résultat fusion : [1, 2, 6]
Fusion de  [3, 9] [1, 2, 6]
Résultat fusion : [1, 2, 3, 6, 9]
[4, 3, 5, 6, 4]
[4, 3]
[4]
[3]
Fusion de  [4] [3]
Résultat fusion : [3, 4]
[5, 6, 4]
[5]
[6, 4]
[6]
[4]
Fusion de  [6] [4]
Résultat fusion : [4, 6]
Fusion de  [5] [4, 6]
Résultat fusion : [4, 5, 6]
Fusion de  [3, 4] [4, 5, 6]
Résultat fusion : [3, 4, 4, 5, 6]
Fusion de  [1, 2, 3, 6, 9] [3, 4, 4, 5, 6]
Résultat fusion : [1, 2, 3, 3, 4, 4, 5, 6, 6, 9]


[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

La preuve se fait par récurrence :
* le cas de base (taille 0 et taille 1) est trivial
* Si le tri fonctionne sur les tableaux de taille $<n$ alors, les deux sous tableaux seront triés. Il reste à prouver que la fonction `fusion` répond bien au problème, en particulier que le tableau renvoyé est bien trié. On peut le voir avec un invariant de boucle, à chaque itération de la boucle, les valeurs déjà ajoutées au tableaux sont toutes inférieures ou égales à l'ensemble des valeurs restantes dans t1 t2.

In [136]:
def fusionCheck(t1, t2):
    """
    Input : t1 et t2 deux tableaux déjà trié
    Output : un nouveau tableau t contenant les valeurs triées de t1 et t2
    """
    i = 0
    j = 0
    t = []
    while i < len(t1) and j < len(t2):
        if t1[i] <= t2[j]:
            t.append(t1[i])
            i+=1
        else:
            t.append(t2[j])
            j+=1
        assert all(v <= w for v in t for w in t1[i:]) and all(v <= w for v in t for w in t2[j:])
    if i < len(t1):
        t.extend(t1[i:])
    if j < len(t2):
        t.extend(t2[j:])
    return t

def triFusionCheck(t):
    if len(t) <= 1: # cas d'arret
        return t
    m = len(t)//2 # la moitié du tableau
    return fusionCheck(triFusionCheck(t[:m]), triFusionCheck(t[m:]))

In [137]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
t = triFusionCheck(t)
t

[1, 2, 3, 3, 4, 4, 5, 6, 6, 9]

**Quelle est la complexité de l'algorithme ?**

On découpe systématiquement le tableau en deux parts égales (contrairement au tri rapide, cela ne dépend plus des valeurs). A chaque étape, il faut effectuer une copie du tableau (pour créer les sous-tableaux) et la fusion, cela se fait en $O(n)$. On obtient donc une formule récursive pour la complexité du type de

$\begin{align}
f( n \leq 1) &= 1 \\
f(n) &= n + 2 f \left(\frac{n}{2} \right) \\
\end{align}$

et donc une complexité en $O(n \log(n))$ **dans tous les cas.**

**Quelle est la complexité en espace de l'algorithme ?** 

De façon optimisée, on peut se contententer d'un seul tableau auxilliaire et donc une complexité mémoire en $O(n)$.

**Le tri est-il effectué sur place ?**

Non. Il y a moyen de l'implanter sur place sans augmenter la complexité mémoire mais c'est plus technique.

**Le tri est-il stable ?** Oui (en fonction de comment on écrit la fusion) 

**Conclusion sur le tri Fusion**

C'est un tri avec une bonne efficacité et il est utilisé en pratique. Par exemple, l'algorithme de tri de python le *Timsort* est un dérivé du tri fusion (mélangé avec du tri par insertion)

**Avantages**

* Complexité $O(n \log(n))$ dans le pire des cas

**Inonvénients**

* Complecité $O(n \log(n))$ dans le meilleure des cas (non linéaire)
* Complexité mémoire $O(n)$ : nécessessite des allocations
* Pas de tri sur place


## Exercice : le tri pas rapide

Voici un algorithme

In [132]:
def triPasRapideRec(t, i, j):
    if j-i == 1 and t[j] < t[i]:
        t[i], t[j] = t[j], t[i]
    if j-i <= 1:
        return
    k = (j+1-i)//3
    triPasRapideRec(t, i, j - k)
    triPasRapideRec(t, i+k, j)
    triPasRapideRec(t, i, j-k)

def triPasRapide(t):
    triPasRapideRec(t, 0, len(t) - 1)

In [133]:
t = [9, 3, 6, 1, 2, 4, 3, 5, 6, 4]
triPasRapide(t)
t

In [134]:
testTri(triPasRapide)

* Ajouter des affichages pour comprendre le fonctionnement de l'algorithme sur l'exemple `[9,3,6,1]`
* On veut prouver par récurence que l'algorithme fonctionne. 
  - Quel est le cas de base ? 
  - Soit $u < v$ dans le tableau, si $u$ apparait avant $v$ dans le tableau, peuvent-ils être échangés ?
  - Supposons que $v$ apparait avant $u$ et qu'ils appartiennent tous les deux aux deux premiers tiers, que se passe-t-il ?
  - même question mais ils appartiennent aux deux derniers tiers
  - Et si $v$ est dans le premier tiers et $u$ dans le dernier tiers ?
* Pour un tableau de taille $n$, exprimer sous forme d'une fonction récursive $f(n)$ le nombre d'appels effectués
* Un théorème d'analyse d'algorithme, le *master theorem* nous dit que si la complexité d'un algorithme récursif s'exprime sous la forme 

$\begin{equation}
f(n) = a f\left( \frac{n}{b} \right)
\end{equation}
$

avec $a \geq 1$ et $b > 1$, alors la complexité de l'algorithme est de $n^{\frac{\log(a)}{\log(b)}}$. En comparant avec les algorithmes connus, l'algorithme `TriPasRapide` est-il efficace ?