# Les Algorithmes de tri

---
## Introduction

Trier des donn√©es, consiste √† les ranger suivant un ordre d√©fini au pr√©alable. 
Par exemple nous pouvons trier des donn√©es num√©riques en utilisant l‚Äôordre d√©fini en math√©matiques : **a est avant b si a<b**. 

Si nous trions l‚Äôensemble de nombres 3, 8, 5 et 2, nous obtenons l‚Äôensemble 2, 3, 5 et 8 et nous disons que les nombres sont rang√©s suivant l‚Äôordre **croissant**. Si nous les rangeons dans l‚Äôordre inverse, nous parlons d‚Äôordre **d√©croissant**.

Nous proc√©dons par des comparaisons successives entre deux √©l√©ments et effectuons √©ventuellement une permutation des √©l√©ments compar√©s. Le nombre de permutations est donc toujours inf√©rieur au nombre de comparaisons. 

Le **co√ªt** ou la **complexit√©** d‚Äôun algorithme sera fonction du nombre de comparaisons et permutations effectu√©es par cet algorithme. 
Pour un algorithme donn√©, le co√ªt peut √™tre diff√©rent suivant les cas √† traiter, il y a des cas favorables, et d‚Äôautres non.

---
## Le tri par s√©lection
>üìå **On parcourt la liste en s√©lectionnant le plus petit √©l√©ment que l'on place en d√©but de liste.**

### Pr√©sentation de l'algorithme
Pour chaque position de la liste, on va **s√©lectionner** le plus petit √©l√©ment dans la suite de la liste et l'√©changer avec la position actuelle (s'il est plus petit), d'o√π le nom de l'algorithme. Regardons une [vid√©o explicative](https://youtu.be/8u3Yq-5DTN8).
- Algorithme :

```
pour i allant de 0 √† taille(liste) - 1
    mini ‚Üê i
    pour j allant de i √† taille(liste)
        si liste[j] < liste[mini]
            mini ‚Üê j
    tmp ‚Üê liste[i]
    liste[i] ‚Üê liste[mini]
    liste[mini] ‚Üê tmp

```

### Un exemple
<pre>
<font color="red">12 </font>-  5 - 11 - 20 -  7 (i=0) le plus petit √©l√©ment de [5,11,20,7] est 5 (&lt;12) -> on l'√©change avec 12
<font color="green"> 5 - </font><font color="red">12</font> - 11 - 20 -  7 (i=1) le plus petit √©l√©ment de [11,20,7] est 7 (&lt;12) -> on l'√©change avec 12
<font color="green"> 5 -  7 - </font><font color="red">11</font> - 20 - 12 (i=2) le plus petit √©l√©ment de [20,12] est 12 (&gt;11) -> on ne fait rien
<font color="green"> 5 -  7 - 11 - </font><font color="red">20</font> - 12 (i=3) le plus petit √©l√©ment de [12] est 12 (&lt;20) -> on √©change avec 20
<font color="green"> 5 -  7 - 11 - 12 - 20</font>
</pre>


### Terminaison et correction
- Nous avons deux boucles `pour` imbriqu√©es donc le nombre de passages dans ces deux boucles est parfaitement d√©termin√© et il est √©videmment **fini**.

- L'invariant de boucle sera dans ce cas : "*Pour chaque valeur de `i` trait√©e, les valeurs `liste[0:i-1]` seront d√©j√† tri√©es.*"  
L'invariant est vrai pour `liste[0]` puisqu'un seul √©l√©ment est forc√©ment tri√©...  
Apr√®s un passage pour indice √©gal √† `i`, la liste `liste[0:i-1]` est tri√©e et tous les √©l√©ments de `liste[i:n]` sont sup√©rieurs √† tous les √©l√©ments de `liste[0:i-1]`, alors au passage suivant le minimum de la liste `liste[i:n]` est plac√© en position d‚Äôindice i => Donc la liste `liste[0:i]` sera tri√©e.  
L'invariant est vrai √† l'initialisation et si il est vrai pour `i`, il sera vrai pour `i+1`. Donc l'invariant sera vrai √† la fin de la boucle, soit pour `i=taille(liste)`.

    => Donc √† la terminaison de l'algorithme, **toutes les valeurs de la liste seront tri√©es.**

### Complexit√©
- Si `n` est la taille de la liste nous avons deux boucles `pour` imbriqu√©es, et pour chaque valeur de `i`, `j` prendra les valeurs `i+1`,`i+2`,`i+3`,... jusqu'√† `n-1` soit `n-i-1` valeurs.
- Au total, cela nous fait : `(n-1) + (n-2) + . . . + 2 + 1` comparaisons. 
- Un calcul math√©matique nous donne `n(n+1)/2` comparaisons soit donc de l'odre de **n<sup>2</sup>** op√©rations. 

    => La complexit√© du tri par s√©lection est donc **quadratique.**

### Application
- Impl√©mentez l'algorithme du tri par s√©lection :

In [None]:
# √† compl√©ter


In [None]:
# V√©rification
liste = [12,5,11,20,7,42]
tri_selection(liste)
liste

<center><span style="color:red"><b><font size="3">
Attention, sauvegardez votre notebook avant de lancer une fonction qui traite un gros volume de donn√©es...
</font></b></span></center>

- Testez-le maintenant en faisant varier le nombre d'√©l√©ments de d√©part (variable `nbelt`) _‚ö†Ô∏è Allez doucement, le tri peut-√™tre tr√®s long_

In [None]:
# √† ex√©cuter
from timeit import default_timer as timer
from random import randint

# Nombre d'√©l√©ments de la liste
nbelt=2000
# G√©n√©ration de la liste
maliste=[randint(0,nbelt) for x in range(nbelt)]
# D√©marrage du chrono
debut_chrono = timer()
# Tri de la liste
tri_selection(maliste)
# Fin du chrono et calcul de la dur√©e
fin_chrono = timer()
duree = fin_chrono - debut_chrono
# Affichage du r√©sultat
print("Les",nbelt,"√©l√©ments de la liste ont √©t√© tri√©s en",duree,"secondes")

- Essayez maintenant de comparer la dur√©e en triant la liste avant : 

In [None]:
# √† ex√©cuter

from timeit import default_timer as timer
from random import randint

# Nombre d'√©l√©ments de la liste
nbelt=2000
# G√©n√©ration de la liste
maliste=[randint(0,nbelt) for x in range(nbelt)]
# Tri de la liste
maliste.sort()
# D√©marrage du chrono
debut_chrono = timer()
# Tri de la liste
tri_selection(maliste)
# Fin du chrono et calcul de la dur√©e
fin_chrono = timer()
duree = fin_chrono - debut_chrono
# Affichage du r√©sultat
print("Les",nbelt,"√©l√©ments de la liste ont √©t√© tri√©s en",duree,"secondes")

- Que remarquez-vous ?

---
## Le tri par insertion
>üìå **On parcourt la liste en ins√©rant l'√©l√©ment √† sa place dans la premi√®re partie de la liste.**


### Pr√©sentation de l'algorithme
Le tri par insertion est celui que l'on utilise naturellement pour trier une poign√©e de cartes.  
On parcourt tous les √©l√©ments , et on va l'**ins√©rer** √† sa place dans les √©l√©ments d√©j√† tri√©s qui le pr√©c√®dent, d'o√π le nom de l'algorithme. Regardons une [vid√©o explicative](https://youtu.be/bRPHvWgc6YM).  
- Algorithme :

```
pour i allant de 0 √† taille(liste)
    cle ‚Üê liste[i]
    j ‚Üê i - 1
    tant que j>=0 et liste[j]>cle
        liste[j+1] ‚Üê liste[j]
        j ‚Üê j-1
    liste[j+1] ‚Üê cle
```

### Un exemple
<pre>
12 - <font color="red"> 5</font> - 11 - 20 -  7  (i=1) cle=5 et 5 &lt; 12 donc on d√©cale 12
   - 12 - 11 - 20 -  7        fin de boucle, on ins√®re 5
<font color="green"> 5</font> - 12 - 11 - 20 -  7  
<font color="green"> 5</font> - 12 - <font color="red">11</font> - 20 -  7  (i=2) cle=11 et 11 &lt; 12 donc on d√©cale 12 
 5 -    - 12 - 20 -  7        11 &gt; 5 donc fin de boucle, on ins√®re 11
<font color="green"> 5 - 11</font> - 12 - 20 -  7  
 5 - 11 - 12 - <font color="red">20</font> -  7  (i=3) cle=20 et 20 &gt; 12 donc fin de boucle, on ne fait rien 
<font color="green"> 5 - 11 - 12 - 20</font> -  7  
 5 - 11 - 12 - 20 - <font color="red"> 7</font>  (i=4) cle=7 et 7 &lt; 20 donc d√©cale 20
 5 - 11 - 12 -    - 20        7 &lt; 12 donc on d√©cale 12
 5 - 11 -    - 12 - 20        7 &lt; 11 donc on d√©cale 11
 5 -    - 11 - 12 - 20        7 &gt; 5 donc fin de boucle, on ins√®re 7
<font color="green"> 5 -  7 - 11 - 12 - 20</font>  
</pre>



### Terminaison et correction
- Nous avons une boucle `pour` donc le nombre de passages dans cette boucle est parfaitement d√©termin√©, la boucle `tant que` contient la d√©cr√©mentation de `j` qui conditionne sa sortie donc la boucle se termine √©galement. L'algorithme est donc **fini**.

- L'invariant de boucle sera aussi dans ce cas : "*Pour chaque valeur de `i` trait√©e, les valeurs `liste[0:i-1]` seront d√©j√† tri√©es.*"  
L'invariant est vrai pour `liste[0]` puisqu'un seul √©l√©ment est forc√©ment tri√©...  
Apr√®s un passage pour indice √©gal √† `i`, la liste `liste[0:i-1]` est tri√©e, alors au passage suivant l'√©l√©ment `cle` sera ajout√© √† la bonne place dans cette liste.  => Donc la liste `liste[0:i]` sera tri√©e.  
L'invariant est vrai √† l'initialisation et si il est vrai pour `i`, il sera vrai pour `i+1`. Donc l'invariant sera vrai √† la fin de la boucle, soit pour `i=taille(liste)`.

    => Donc √† la terminaison de l'algorithme, **les valeurs `liste[0:taille(liste)]` seront tri√©es.** (soit la liste compl√®te) 

### Complexit√©
- Si `n` est la taille de la liste nous une premi√®re boucle `for` faisant varier `i`, et pour chaque valeur de `i`, `j` prendra les valeurs `i-1`,`i-2`,`i-3`,... jusqu'√† `0` soit `i` valeurs.
- Au total, cela nous fait : `1 + 2 + . . . + (n-1) + n` comparaisons. 
- Un calcul math√©matique nous donne `n(n+1)/2` comparaisons soit donc de l'odre de **n<sup>2</sup>** op√©rations. 

    => La complexit√© du tri par insertion est donc √©galement **quadratique.**

### Application
- Impl√©mentez l'algorithme du tri par insertion :

In [None]:
# √† compl√©ter


In [None]:
# V√©rification
liste = [12,5,11,20,7,42]
tri_insertion(liste)
liste

<center><span style="color:red"><b><font size="3">
Attention, sauvegardez votre notebook avant de lancer une fonction qui traite un gros volume de donn√©es...
</font></b></span></center>

- Testez-le maintenant en faisant varier le nombre d'√©l√©ments de d√©part (allez doucement, le tri peut-√™tre tr√®s long) :

In [None]:
# √† ex√©cuter
from timeit import default_timer as timer
from random import randint

# Nombre d'√©l√©ments de la liste
nbelt=2000
# G√©n√©ration de la liste
maliste=[randint(0,nbelt) for x in range(nbelt)]
# D√©marrage du chrono
debut_chrono = timer()
# Tri de la liste
tri_insertion(maliste)
# Fin du chrono et calcul de la dur√©e
fin_chrono = timer()
duree = fin_chrono - debut_chrono
# Affichage du r√©sultat
print("Les",nbelt,"√©l√©ments de la liste ont √©t√© tri√©s en",duree,"secondes")

- Essayez maintenant de comparer la dur√©e en triant la liste avant, que remarquez-vous ?

In [None]:
# √† ex√©cuter
from timeit import default_timer as timer
from random import randint

# Nombre d'√©l√©ments de la liste
nbelt=2000
# G√©n√©ration de la liste
maliste=[randint(0,nbelt) for x in range(nbelt)]
# Tri de la liste
maliste.sort()
# D√©marrage du chrono
debut_chrono = timer()
# Tri de la liste
tri_insertion(maliste)
# Fin du chrono et calcul de la dur√©e
fin_chrono = timer()
duree = fin_chrono - debut_chrono
# Affichage du r√©sultat
print("Les",nbelt,"√©l√©ments de la liste ont √©t√© tri√©s en",duree,"secondes")

- Que remarquez-vous ?

---
## Autres algorithmes
Il existe d'autres algorithmes de tri c√©l√®bres. Nous ne les √©tudierons pas tous en d√©tail mais leur d√©couverte est int√©ressante.


### Le tri fusion
Nous allons le tri fusion dans le chapitre **5 - Algorithmique**, en effet celui-ci utilise la m√©thode ¬´ **diviser pour r√©gner** ¬ª qui consiste √† diviser un gros probl√®me en sous-probl√®mes plus petits et qu iest au programme de terminale.

### Le tri √† bulles
Le tri √† bulles est un algorithme qui consiste √† faire **remonter** progressivement les plus grands √©l√©ments d'un tableau, comme les bulles d'air remontent √† la surface d'un liquide. Ce tri est peu performant et il n‚Äôest donc quasiment pas utilis√© en pratique.

### Le tri rapide
L‚Äôalgorithme de tri rapide (¬´ _quick sort_ ¬ª en anglais) a √©t√© invent√© dans les ann√©es 60. Il s‚Äôagit d‚Äôun algorithme de type **dichotomique**. Le principe est de s√©parer l‚Äôensemble des donn√©es en deux parties. La s√©paration se fait par rapport √† une valeur pivot, en deux ensembles de valeurs inf√©rieures ou sup√©rieures √† la valeur pivot. Les deux ensembles sont ensuite trait√©s s√©par√©ment de la m√™me mani√®re.

### Comparatif des diff√©rents tris
Le site suivant donne un exemple de chacun des tris et montre un tres bon exemple de comparaison des algorithmes de tri les plus c√©l√®bres sur une liste  : [Algorithmes de tri](http://lwh.free.fr/pages/algo/tri/tri.htm)

