# Introduction

Un des éléments de base de l'algorithmique -- et donc de la programmation -- est l'étude et l'utilisation d'algorithmes de tri.

Dans toute la suite, on considère une liste de taille `n` *strictement positive.*

On utilisera le fonction `randint` du module `random` afin de générer des listes aléatoires :

In [1]:
from random import randint

# Tri par sélection

Le principe est le suivant : on parcourt la liste une première fois en entier, en sélectionnant son plus grand élément pour l'échanger avec son dernier élément. Ainsi, à la fin du premier passage, la liste a son plus grand élément à la fin.

Ensuite, on itère le procédé sur la liste composée des $n-1$ premiers éléments de la liste initiale, et on recommence... forcément, on tombe à un moment sur la liste composé uniquement du premier élément de la liste, et on s'arrête là.

In [6]:
def selec_tri(v):
    n = len(v)
    if n>1:
        i_max = 0
        for i in range(n):
            if v[i]>v[i_max]:
                i_max = i
        v[-1],v[i_max] = v[i_max],v[-1]
        l = v[:-1] ## permet d'éviter les problèmes d'adressage des listes en Python
        selec_tri(l) ## on trie la liste des n-1 premiers éléments
        v[:-1] = l ## on remplace les n-1 premiers éléments par leur liste triée

On peut donc essayer notre fonction `selec_tri` sur une liste générée au hasard : exécutez plusieurs fois la cellule suivante pour générer une liste aléatoire de 25 nombres entre -50 et 50, l'afficher, et la trier.

In [3]:
n = int(input("Taille n de la liste :"))
v = [randint(-50,50) for _ in range(100)]
print("Liste initiale :","\n",v)
selec_tri(v)
print("Liste triée :","\n",v)

Taille n de la liste :200
Liste initiale : 
 [32, -42, -15, 42, 38, -27, -24, -38, 49, -15, 22, 34, 7, 4, 34, 13, 49, 36, 38, 42, -24, -4, -2, -45, -43, 1, 11, 10, -16, 5, -23, -33, -11, -34, 34, 43, -45, -6, 14, 43, -1, -20, 10, -4, -43, -23, -31, -34, 0, 20, 35, -30, -6, 12, -32, -40, -28, -35, 1, -11, 13, -37, -41, -41, 15, -43, -42, 46, -28, -39, -33, -44, -41, -27, -14, -33, 25, 41, 50, -47, -18, -23, -20, 18, 43, -38, -35, 15, 8, 20, -4, 4, 49, 32, 2, 14, -21, 36, 11, -5]
Liste triée : 
 [-47, -45, -45, -44, -43, -43, -43, -42, -42, -41, -41, -41, -40, -39, -38, -38, -37, -35, -35, -34, -34, -33, -33, -33, -32, -31, -30, -28, -28, -27, -27, -24, -24, -23, -23, -23, -21, -20, -20, -18, -16, -15, -15, -14, -11, -11, -6, -6, -5, -4, -4, -4, -2, -1, 0, 1, 1, 2, 4, 4, 5, 7, 8, 10, 10, 11, 11, 12, 13, 13, 14, 14, 15, 15, 18, 20, 20, 22, 25, 32, 32, 34, 34, 34, 35, 36, 36, 38, 38, 41, 42, 42, 43, 43, 43, 46, 49, 49, 49, 50]


La complexité de cet algorithme de tri est de l'ordre $O(n^2)$.

# Tri rapide ou « *quick sort* »

Le principe de ce tri-là est un peu plus astucieux. 

Dans le tri à bulle, on sélectionnait la plus grande valeur du tableau, on la mettait à part (à la fin), et on triait le reste. On réduisait donc la taille du problème de 1 à chaque fois.

Ici, on va faire encore plus fort: on va couper la liste en deux parties, trier séparément les deux parties et tout recoller ensemble à la fin. Bien sûr, on ne va pas couper la liste au milieu comme des brutes.

In [4]:
def quick_tri(v):
    n = len(v)
    if n>1:
        piv = n//2 ## choix du pivot ; on prend ici le plus naïf, l'élément central de la liste.
        vsmal,vbig = [],[]
        for i,el in enumerate(v):
            if i!=piv:
                if el < v[piv]:
                    vsmal.append(el)
                else:
                    vbig.append(el)
        quick_tri(vsmal)
        quick_tri(vbig)
        v[:] = vsmal + [v[piv]] + vbig

On peut donc l'essayer sur une liste au hasard, encore :

In [5]:
v = [randint(-50,50) for _ in range(25)]
print("Liste initiale :","\n",v)
quick_tri(v)
print("Liste triée :","\n",v)

Liste initiale : 
 [6, 8, 24, -7, -23, -45, 43, -1, 0, 19, 25, -26, -15, 16, -41, 43, -15, 16, 16, -18, 41, -34, 7, -25, 19]
Liste triée : 
 [-45, -41, -34, -26, -25, -23, -18, -15, -15, -7, -1, 0, 6, 7, 8, 16, 16, 16, 19, 19, 24, 25, 41, 43, 43]


** *Complexité* **

La complexité de cet algorithme de tri dépend du choix du pivot. Avec un bon pivot, on peut faire en sorte de diviser par un facteur 2 la taille de la liste à chaque fois. Alors, on est amené à une complexité vérifiant la relation
$$
    C_n = 1 + 3 + \sum_{k=1}^{n}O(1) + 2C_{\left\lfloor\frac{n}{2}\right\rfloor} =  2C_{\left\lfloor\frac{n}{2}\right\rfloor} + O(n)
$$

Ce type de relation de récurrence est quasiment impossible à résoudre dans le cas général ; cependant, un théorème important en analyse des algorithmes, nommé le *Master's theorem*, nous fournit le résultat: la complexité est quasi-linéaire. $$C_n = \Theta(n\log n) $$

Maintenant, avec un pivot complètement naze (par exemple le plus grand élément de la liste), on sépare la liste en une liste comportant le pivot tout seul et une autre qui est donc de taille $n-1$... et on est ramené à un tri par sélection ! Donc **dans le pire des cas,** la complexité est en $O(n^2)$.