# Algorithmes de tris

## Trier, c'est comparer les éléments entre eux

|liste à trier|relation d'ordre|outil de comparaison|liste triée|
|:-|:-|:-|:-|
|`[2, 6, 0, 1, 10]`|ordre croissant|`<`|`[0, 1, 2, 6, 10]`|
|`[2, 6, 0, 1, 10]`|ordre décroissant|`>`|`[10, 6, 2, 1, 0]`|
|`['Max', 'Bob', 'Charly', 'Jenny', 'Alice']`|ordre alphabétique|`<` en python|`['Alice', 'Bob', 'Charly', 'Jenny', 'Max']`|

In [38]:
#Rappel
'Alice' < 'Bob'

True

Trier une liste consiste à ordonner ses éléments selon certaines règles prédéterminées appelées **relation d'ordre**. 

Il suffit de **comparer** 2 éléments du tableau suivant **la relation d'ordre** pour déterminer "qui vient avant l'autre" $\Longrightarrow$ **La COMPARAISON est l'opération de base du tri**.

## Pourquoi trier ?

Le tri est une opération très courante dans la vie de tous les jours comme en informatique :
* trier des livres par ordre alphabétique
* trier des fichiers par taille
* trier des compétiteurs par performance, par catégorie
* etc...

Une fois les données triées, il est plus rapide de :
* rechercher une donnée (recherche dichotomique)
* comparer 2 tableaux entre eux
* rechercher l'élément le plus fréquent
* compter les éléments identiques d'un tableau
* etc ...

$\Longrightarrow$ Le tri est un "ingrédient de base" de très nombreux algorithmes. 
* Pour cette raison, les informaticiens ont cherché à concevoir des algorithmes de tris très efficaces (voir `premiere/bloc7/Cours_complexite_d_un_algorithme`)
* Il existe de très nombreux algorithmes de tris différents, fruit de la quête du meilleur algorithme
    * tri par sélection (première)
    * tri par insertion (première)
    * tri fusion (terminale)   
    * tri à bulles
    * tri rapide
    * Timsort (le tri de python)
    * [D'autres algorithmes de tris parmi les plus courants...](https://fr.wikipedia.org/wiki/Algorithme_de_tri#Comparaison_des_algorithmes)


## Plusieurs algorithmes de tri, lequel choisir ?

_C'est simple : on utilise le meilleur tri (meilleure complexité) conçu par les informaticiens_

... Malheureusement, ce n'est pas si simple : Il n'y a pas vraiment de "meilleur" algorithme de tri.

* D'abord parce qu'il n'y a pas 1 mais 2 complexités (même si dans le programme de NSI, on s'intéresse surtout à la complexité temporelle) :
    * la complexité temporelle (le temps de calcul de l'algorithme)
    * la complexité spatiale (la quantité de mémoire utilisée par l'algorithme)
    * Et donc bien souvent une bonne complexité temporelle "se paye" par une mauvaise complexité spatiale
    

* Ensuite parce qu'il faut distinguer complexité :
    * Dans le pire cas (situation de départ qui fera que le temps de calcul sera le plus important)
    * Dans le cas optimal (situation de départ qui fera que le temps de calcul sera le moins important)
    * Dans le cas général
    

### Mais concrètement on choisit lequel ?

* Si le tableau contient de très nombreuses données, on va privilégier des algorithmes de tris de bonne complexité temporelle
 
 
* Si les données du tableau sont de très grandes tailles, on va privilégier des algorithmes de tris de bonne complexité spatiale  


* Le tri [Timsort](https://fr.wikipedia.org/wiki/Timsort), inventé en 2002 et implémenté par python est un très bon choix :
    * `sorted` : **fonction** qui **renvoie** une nouvelle liste triée
    * `sort` : **méthode** triant une liste en place (**effet de bord**)
    

* Si on a une idée sur l'état initial du tableau, on peut privilégier un algorithme particulier. Par exemple  on peut utiliser le tri par insertion, pourtant moins bon dans le cas général que le tri TimSort, si on sait que le tableau est déjà presque trié...