# Les tris
Les tris sont des algorythmes très utilisés, notamment avant de stocker des résultats, notamment car la recherche dans une liste trièée est bien plus rapide que dans une liste non triée.
## Tri par insertion
### Algorithme
Le principe du tri par insertion est de trier progressivement une liste en insérant les éléments un à un à sa place dans le début de la listé qui est trié.

In [14]:
def tri_insertion(l):
    """Trie sur place la liste l en utilisant le tri par insertion
    """
    for i in range(1,len(l)):
        # Ici, l est triée jusqu'à l'indice i exclus.
        # Il reste à insérer l[i] dans l[:i] qui est triée
        temp = l[i]  # on stocke la valeur à insérer (l[i] sera écrasé)
        j=i
        while j>0 and temp<l[j-1]:  # on parcourt l[:i] jusqu'à ce qu'on ait trouvé la
                                    # place de temp
            l[j]=l[j-1]  # tant qu'on n'a pas trouvé sa place, on décale les éléments
                         # de l[:i]
            j=j-1
        l[j]=temp  # une fois la place de temp trouvée, on l'y met

### Test et complexité spatiale
On peut tester cet algorythme sur un exemple simple :

In [30]:
from random import randint
liste1 = [randint(0,10) for i in range(10)]
print(liste1)
tri_insertion(liste1)
print(liste1)
liste2 = [randint(0,10) for i in range(10)]  # avoir une autre liste triée nous
                                             # servira pour la suite
tri_insertion(liste2)

[8, 4, 10, 3, 9, 3, 2, 3, 5, 5]
[2, 3, 3, 3, 4, 5, 5, 8, 9, 10]


Le tri insertion ainsi écrit est dit "sur place" : il modifie la liste en la triant et nécessite peu d'espace mémoire.

### Complexité temporelle
On choisit de compter le nombre de comparaison avec un élément de la liste : "temp<l[j-1]"
La complexité de cet algorithme dépend du nombre d'exécutions de la boucle while qui dépend de la liste fournie en argument. On peut l'évaluer dans 2 cas : 
#### Meilleur des cas : la liste est déjà triée
Si la liste est déjà triée, "temp<l[j-1]" vaut False et on ne rentre pas dans la boucle while. "temp<l[j-1]" aura donc été exécuté une seule fois par tour de boucle : $$C(n)=\sum_{i=1}^{n-1} 1 =n-1=O(n)$$
#### Pire des cas : la liste est trée dans l'ordre décroissant
Si la liste est déjà triée das l'ordre décroissant, "temp<l[j-1]" vaut True à chaque appel et la boucle while est exécutée i fois. "temp<l[j-1]" aura donc été exécuté i fois par tour de boucle : $$C(n)=\sum_{i=1}^{n-1} i =\frac{n(n-1)}{2}=O(n^2)$$
#### Complecité en moyenne
On admet que la complexité se fait en moyenne en $O(n^2)$

## Tri fusion
Le tri fusion repose sur le principe "diviser pour reigner".
- Trier une liste vide ou d'un élément est facile : il n'y a rien à faire.
- Pour trier une liste d'au moins deux éléments, il suffit de la couper en deux, de trier chacune de deux moitiers puis de fusionner les deux listes triées.
### Fusion
Pour réaliser le tri fusion, on doit d'abbord disposer d'une fonction fusion qui fusionne deux listes triées en une liste triée contenant les éléments des deux listes prises en argument.

In [25]:
def fusion(l1,l2):
    l = []  # liste qui contiendra la fusion de l1 et l2
    i1 = 0  # indice pour parcourrir l1
    i2 = 0  # indice pour parcourrir l2
    while i1+i2 < len(l1)+len(l2):  # on a fini si l a autant d'éléments que l1 et l2
                                    # réunis
        if i1 >= len(l1):  # si on a pris tous les éléments de l1
            l.append(l2[i2])  # on prend un élément de l2
            i2 += 1
        elif i2 >= len(l2):  # idem dans l'autre sens
            l.append(l1[i1])
            i1 += 1
        elif l1[i1] < l2[i2]:  # si le premier élément de l1 est plus petit que celui
                               # de l2
            l.append(l1[i1])  # on prend le 1er élément de l1
            i1 += 1
        else:  # idem dans l'autre sens
            l.append(l2[i2])
            i2 += 1
        # Ici les i1+i2 premiers éléments de l sont les bons
    return l

On peut tester la fonction fusion :

In [28]:
print(liste1)
print(liste2)
print(fusion(liste1,liste2))

[0, 0, 2, 2, 3, 5, 6, 7, 8, 10]
[0, 2, 3, 5, 5, 5, 6, 7, 9, 10]
[0, 0, 0, 2, 2, 2, 3, 3, 5, 5, 5, 5, 6, 6, 7, 7, 8, 9, 10, 10]


### Tri fusion

In [29]:
def tri_fusion(l):
    if len(l) <= 1:  # si la liste contient 1 ou 0 élément, elle est déjà triée
        return l
    else:
        i = len(l)//2  # indice du milieu de l
        return fusion(tri_fusion(l[:i]), tri_fusion(l[i:]))  # on coupe en 2, on trie
                                                             # et on fusionne

### Test et complecité spatiale
Le tri fusion ne modifie pas la liste passée en argument, il crée une nouvelle liste. Il n'est pas sur place. De la mémoire est utilisée en plus de la mémoire déjà utilisée par la liste à trier.

**Remarque :** Il est possible d'écrire une version sur place du tri fusion.

In [32]:
liste = [randint(0,10) for i in range(10)]
print(liste)
print(tri_fusion(liste))

[7, 7, 3, 6, 0, 8, 1, 5, 1, 8]
[0, 1, 1, 3, 5, 6, 7, 7, 8, 8]


### Complexité
#### Complexité de la fonction fusion
Notons $N_1$ et $N_2$ les nombres d'éléments des listes l1 et l2 et $F(N_1,N_2)$ le nombre d'appel à la fonction append. Dans la boucle while, soit i1 soit i2 augmente d'un, i1+i2 augmente donc d'un par tour de boucle, il y a donc $N_1+N_2$ tours de boucle, donc $N_1+N_2$ appels à la fonction append : $F(N_1,N_2)=N_1+N_2$
#### Complexité du tri fusion
Soit $N$ le nombre d'éléments de la liste à trier. Faisons l'hypothèse que $N$ soit une puissance de 2 : $N=2^p$, i.e. $p=\log_2(N)$.
On compte le nombre d'appels à la fonction append (qui a lieu, comme on l'a vu dans la fonction fusion).
$$C(N) = C(\frac{N}{2}) + C(\frac{N}{2}) + F(\frac{N}{2},\frac{N}{2}) = N + 2C(\frac{N}{2})$$
Notons $c(p)=C(2^p)$
$$c(p)=C(2^p)=2^p + 2\times C(\frac{2^p}{2})=2^p + 2\times C(2^{p-1})=2^p+2\times c(p-1)$$
$$\frac{c(p)}{2^p}=1+\frac{c(p-1)}{2^{p-1}}$$
Posons $u_p=\frac{c(2^p)}{2^p}$, alors
$$u_p=1+u_{p-1}$$
De plus, $C(1)=0$ donc $c(0)=0$ donc $u_0=0$ d'où
$$u_p=p$$
$$c(p)=2^p\times p$$
$$C(N)=2^{\log_2(N)}\times \log_2(N)=N\times \log_2(N)$$