# Remarques générales

- En informatique, tri / trier a le sens de classement / classer 
  - classer par ordre alphabétique les livres d'une librairie ;
  - classer les élèves selon leurs notes ;
  - ...
- Travailler sur des séquences triées permet d'avoir une organisation des données et de facilité des opérations
  - Exemple : recherche dichotomique
- Contre-partie : trier a un _coût_
- Un tri se fait selon un critère : relation d'ordre entre les éléments
- Il existe de nombreux algorithmes de tri :
  - tri à bulles
  - tri par sélection
  - **tri par insertion**
  - tri par tas
  - **tri rapide**
  - tri fusion
  - ...

# Données

- Une séquences de données
- Mutable
- Accès direct aux éléments par indice
- Homogène (les éléments de la structure sont tous du même type)
- En Python : ```list```

# Comparer deux valeurs

- Les éléments doivent comparable deux à deux
- Existence d'un prédicat (fonction qui retourne un booléen) ```ordre(x, y)``` qui retourne ```True``` si et seulement si ```x```_est plus petit que_ ```y```
- Prédicat pour trier par ordre croissant en python les entiers, les réels, les chaînes de caractères :

In [None]:
def ordre(x, y):
    return x <= y

- Prédicat pour trier par ordre croissant en python les entiers, les réels, les chaînes de caractères :

In [None]:
def ordre(x, y):
    return x >= y

*Remarque :* dans le reste du cours, on utilisera ```<=``` (tri par ordre croissant)

# Tri par insertion

## Insertion dans une séquence triée

### Données

- ```l``` : une liste homogène d'élément ordonnables
- e : un élément à ajouter à la liste

### Hypothèse

La liste ```l``` est triée

### Effet de bord

La liste ```l``` contient l'élément ```x``` et elle est triée

### Principe

- On ajoute ```x``` à la fin de la liste
- On fait "remonter" ```x``` : on recherche le plus grand indice ```k``` tel que ```l[k] <= x```
- En même temps que l'on recherche ```k``` on décale les éléments d'indice plus grand ou égal à ```k``` vers la "droite" de 1 pour laisser de la place à ```x```
- Si ```x < l[0]```, il faut faire attention à ne pas "sortir" de la liste 

In [None]:
def insertion(l, x):
    l.append(x)                     # On ajoute x
    k = len(l) - 1                  # Au début, x est à l'indice len(l) - 1
    while k > 0 and x < l[k-1]:     # Tant que l'on n'a pas atteint la fin de la liste et que l'élément précédent est plus grand que x
        l[k], l[k-1] = l[k-1], l[k] # On fait "remonter" x
        k = k - 1                   # On va insérer à l'indice k à moins que l'on continue à "remonter" le tableau

## Algorithme du tri par insertion

### Donnée

```l``` : une liste, homogène, d'éléments ordonnables

### Sortie

une liste triée contenant les éléments de ```l``` (```l``` n'est pas modifiée)

### Principe

- Algorithme itératif
- A l'itération ```i```, la liste ```lres``` contient les ```i``` premiers éléments de ```l``` et ```lres``` est triée
- On insert ```l[i]``` dans ```lres```

In [None]:
def tri_par_insertion(l):
    lres = []
    for i in range(len(l)):
        insertion(lres, l[i])
    return lres

l = list("TIMOLEON")
lres = tri_par_insertion(l)
print(lres)    

# Tri par insertion en place

La version ci-dessus du tri par insertion crée une nouvelle liste. Il est possible de trier la liste ```l``` passée en paramètre sans crée une nouvelle liste. On appelle cela trier *en place*. 

## Modification de la fonction d'insertion

### Données

- ```l``` : la liste à trier
- i : un indice ```< len(l)``` correspondant au prochain élément à insérer

### Hypothèse

La sous-liste ```l[0:i]``` est triée

### Effet de bord

La sous-liste ```l[0:i+1]``` est triée

### Principe

Le principe est identique à précédemment mais on n'a pas besoin d'insérer l'élément au début.

*Remarque :* le code ci-dessous contient une petite variante pour faire moins d'affectation

In [1]:
def insertion(l, i):
    aux = l[i]
    k = i
    while k > 0 and aux < l[k-1]:
        l[k] = l[k-1]
        k = k - 1
    l[k] = aux

### Coût

- Meilleur des cas : 1 comparaison (```l[i] >= l[i-1]```)
- Pire des cas : i comparaisons (```l[i] < l[0]```)

## Modification du tri par insertion

In [2]:
def tri_par_insertion(l):
    # On peut passer l'itération 0
    for i in range(1, len(l)):
        insertion(l, i)
        
l = list("TIMOLEON")
tri_par_insertion(l)
print(l)

['E', 'I', 'L', 'M', 'N', 'O', 'O', 'T']


### Coût

$n =$ longueur de la liste

- Meilleur des cas (liste déjà triée) : $n - 1$ comparaisons
- Pire des cas (liste triée dans l'ordre inverse) : environ $\frac{n^2}{2}$ comparaison
- En moyenne : $\frac{n^2}{4}$ comparaison
  
*Remarque :* plus la liste est proche d'être triée initialement plus l'algorithme est efficace

# Tri rapide (quicksort)

## Principe

Principe récursif de type _diviser pour régner_

*Cas d'arrêt :* si la liste contient 0 ou 1 élément, elle est triée.

*Cas général :*

1. Choisir un élément de la liste que l'on désigne par le terme de *pivot*
2. Créer une liste $l_1$ des éléments plus petit ou égaux que le pivot (sans l'inclure)
3. créer une liste $l_2$ des éléments strictement plus grand que le pivot
4. Trier $l_1$ via un appel récursif
5. Trier $l_2$ via un appel récursif
6. Reconstruire une liste de la manière suivante :
   1. la liste triée des éléments plus petit ou égaux que que le pivot
   2. le pivot
   3. la liste triée des éléments strictement plus grand que le pivot
   
La liste obtenue est triée.

## Exemple

$l = [32, 7, 89, 78, 87, 90, 54, 1, 46, 91]$

1. Pivot : 32
2. $l_1 = [7, 1]$
3. $l_2 = [89, 78, 87, 90, 64, 46, 91]$
4. $l_1 = [1, 7]$
5. $l_2 = [46, 64, 78, 87, 89, 90, 91]$
6. $[1, 7, 42, 46, 64, 76, 87, 89, 90, 91]$

## Algorithme de partition

In [None]:
def partition(l, indice_pivot):
    l1, l2 = [], []
    pivot = l[indice_pivot]
    
    for i in range(len(l)):
        if i != indice_pivot and l[i] <= pivot:
            l1.append(l[i])
        elif l[i] > pivot:
            l2.append(l[i])
    
    return l1, l2

Coût : $n$ comparaisons avec $n$ la taille de la liste

## Algorithme de tri rapide

In [None]:
def tri_rapide(l):
    if len(l) <= 1:
        return l.copy()
    else:
        indice_pivot = choix_pivot(l)
        l1, l2 = partition(l, indice_pivot)
        l1_triée = tri_rapide(l1)
        l2_triée = tri_rapide(l2)
        return l1_triée + [l[indice_pivot]] + l2_triée
    
l = list("TIMOLEON")
ltriée = tri_rapide(l)
print(ltriée)

- L'algorithme ci-dessus demande de nombreuses constructions de listes
- L'algorithme ci-dessus demande de nombreuses opérations de concaténation
- L'algorithme ci-dessus demande de nombreuses constructions de singletons 
- Impact sur la performance pratique (la performance théorique ne change pas)
- Il est possible d'implémenter le tri rapide pour qu'il soit effectué _en place_

## Choix du pivot

- La fonction ```choix_pivot``` retourne l'indice du pivot
- Plusieurs approches sont possibles
- Le choix du pivot influe fortement sur la performance de l'algorithme
- Idéalement, il faudrait prendre la valeur médiane dans la liste pour que les sous-liste $l_1$ et $l_2$ soient de taille équivalente mais chercher cette valeur est coûteux
- Exemple choix 1 : élément en début de liste

In [None]:
def choix_pivot(l):
    return 0

- Exemple choix 2 : élément au hasard

In [None]:
from random import randint

def choix_pivot(l):
    return randint(0, len(l)-1)

- Exemple choix 2 : on choisit 3 valeurs (première, milieu et dernière) et on retourne la valeur médiane

In [None]:
def choix_pivot(l):
	ind1, ind2, ind3 = 0, (0 + len(l)-1) // 2, len(l)-1
	if l[ind1] >= l[ind2] and l[ind1] <= l[ind3]:
		return ind1
	elif l[ind2] >= l[ind1] and l[ind2] <= l[ind3]:
		return ind2
	else:
		return ind3

## Coût de l'algorithme de tri rapide

- Pire des cas : environ $\frac{n^2}{2}$
- Meilleur des cas : environ $n\log n$
- En moyenne : environ $n\log n$
- Le tri rapide est en pratique plus efficace que le tri par insertion (qui reste plus efficace si la liste est déjà "presque" trié)

# Exercices

## Exercice 1

Implémenter l'algorithme de tri par insertion pour trier en place un tableau d'entiers par ordre décroissant.

*Indication :* Il est interdit de trier le tableau par ordre croissant puis de l'inverser.

In [1]:
def insertion(l, i):
    aux = l[i]
    k = i
    while k > 0 and aux > l[k-1]:
        l[k] = l[k-1]
        k = k - 1
    l[k] = aux

def tri_par_insertion(l):
    # On peut passer l'itération 0
    for i in range(1, len(l)):
       insertion(l, i)
        
l = list("AZERTY")
tri_par_insertion(l)
print(l)



['Z', 'Y', 'T', 'R', 'E', 'A']


## Exercice 2

Le but de cet exercice est d'impémenter en ordre croissant en place le tri rapide d'un tableau d'entiers.

### Question 1

Implémenter une fonction ```choix_pivot(liste, ind1, ind2)``` qui prend en paramètre une liste d'entiers et deux entiers. Cette fonction retourne l'indice du pivot par la tranche de la liste ```liste``` comprise entre l'indice ```ind1``` (inclus) et l'indice ```ind2``` (exclus). Vous implémenterez le choix de pivot consistant à choisir trois éléments du tableau et à retourner l'indice de l'élément médian.  

In [2]:
def choix_pivot (liste, ind1, ind2):
    taille = (ind1 + ind2 -1 )//2
    chiffre1 = liste[ind1]
    chiffre2 = liste[ind2-1]
    chiffre3 = liste[taille]
    if (chiffre1 >= chiffre3) == (chiffre3 > chiffre2):
        return taille
    if (chiffre1 <= chiffre2) == (chiffre2 < chiffre3):
        return [ind2-1]
    return ind1


l = [1, 5, 4, 5, 6, 7, 8, 9, 10]
print(choix_pivot(l,0,9))

1


Il est nécessaire d'implémenter un algorithme de partition qui répartit les éléments du tableau par rapport au pivot dans la tranche même de la liste définie par deux indices ```ìnd1``` (inclus) et ``ìnd2``` (exclus). Il ne faut pas faire de copie de la tranche mais travailler directement sur la liste. La spécification de la fonction est ```partition(liste, indice_pivot, ind1, ind2)``` avec

- ```liste``` : la liste à trier
- ```indice_pivot``` : l'indice initial du pivot
- ```ind1``` : l'indice (inclus) de début de tranche
- ```ind2``` : l'indice (exclus) de fin de tranche

 Le principe de l'algorithme est le suivant :

 1. On échange l'élement à l'indice ```indice_pivot``` (le pivot) et l'élément à l'indice ```ind2 - 1``` (le dernier élément de la tranche).
 2. On sauvegarde un indice ```i``` qui indique le grand indice contenant un élément assuré d'être plus petit que le pivot ; initialement ```i = ind1 - 1``` (personne n'est assuré d'être plus petit que le pivot).
 3. On parcours les éléments de l'indice ```ind1``` à ```ind2-2``` (on ne teste pas ```ind2-1``` car c'est le pivot)
    1. Si l'élément courant est plus petit ou égal on l'échange avec l'élément à l'indice ```i + 1```
    2. Sinon on ne fait rien car  $j \geq i + 1$ et $liste[j] >$ pivot donc l'élément est bien rangé dans la tranche
 4. A la fin de la boucle, on a : i) ```liste[ind1:i+1] <= pivot```, ```liste[i+1:ind2-1] > pivot``` et ```liste[ind2-1] == pivot```. Il reste donc à placer correctement le pivot en l'échangeant avec l'élément se trouvant à l'indice ```i+1``` (c'est-à-dire le premier élément plus grand que le pivot).
 5. On retourne l'indice où se trouve le pivot ; c'est-à-dire ```i+1```.


### Question 2

Implémentez la fonction ci-dessus. Si vous n'y arrivez pas, vous pouvez utiliser l'implémentation donnée après pour faire les questions suivantes.

Une implémentation possible :

In [None]:
def partition(liste, indice_pivot, ind1, ind2):
    # Etape 1
    liste[indice_pivot], liste[ind2-1] = liste[ind2-1], liste[indice_pivot]
    pivot = liste[ind2-1]
    
    # Etape 2
    i = ind1 - 1
    
    # Etape 3
    for j in range(ind1, ind2-1):
        if liste[j] <= pivot:
            i += 1
            liste[i], liste[j] = liste[j], liste[i]
            
    # Etapge 4
    liste[i+1], liste[ind2-1] = liste[ind2-1], liste[i+1]
    
    # Etape 5
    return i + 1

On peut maintenant implémenter l'algorithme de tri rapide. Pour ne pas avoir à créer des tranches de la liste à trier, nous allons spécifier la fonction de la manière suivante ```tri_rapide(liste, ind1, ind2)```. La fonction trie en place la tranche de la liste ```liste``` qui commence à l'indice ```ind1``` (inclus) et se termine à l'indice ```ind2``` (exclus). Pour trier la liste complète, l'appel initial sera donc ```tri_rapide(l, 0, len(l))```. La restriction aux tranches souhaitées pour les appels récursifs se fait en fixant les indices correctement.

### Question3

Implémenter la fonction ```tri_rapide``` respectant la spécification ci-dessus.

In [None]:
def choix_pivot (liste, ind1, ind2):
    taille = (ind1 + ind2 -1 )//2
    chiffre1 = liste[ind1]
    chiffre2 = liste[ind2-1]
    chiffre3 = liste[taille]
    if (chiffre1 >= chiffre3) == (chiffre3 > chiffre2):
        return taille
    if (chiffre1 <= chiffre2) == (chiffre2 < chiffre3):
        return [ind2-1]
    return ind1


l = [1, 5, 4, 5, 6, 7, 8, 9, 10]
print(choix_pivot(l,0,9))

In [None]:
def tri_rapide(liste, ind1, ind2):


### Question 4

Modifier la fonction ```partition``` pour que l'algorithme trie les éléménts par ordre décroissant.

## Exercice 3

Supposons que l'on dispose des données suivantes : une liste nom ```nom``` comporte le nom des étudiants et une liste ```classement``` comportent leur classement respectif : le classement de ```nom[0]``` est  ```classement[0]```, le classement de ```nom[1]``` est ```classement[1]``` et ainsi de suite. On veut trouver les $k$ meilleurs éléves.

*Indication :* On suppose que tous les noms sont uniques et que deux élèves n'ont pas pu avoir la même note.

Vous pouvez utilisez le code ci-dessous pour générer une liste ```nom``` et une liste ```classement```.

In [None]:
from random import randint

def génération_nom_classement(n):
    nom = ["Etudiant " + str(i) for i in range(1, n+1)]
    classement = [i for i in range(1, n+1)]
    for i in range(n-1, -1, -1):
        j = randint(0, i)
        classement[i], classement[j] = classement[j], classement[i]
    return nom, classement

nom, classement = génération_nom_classement(24)
print(nom)
print(classement)


### Question 1

Ecrivez une version ```meilleurs_v1(nom, classement, k)``` qui retourne une liste comportant les noms des $k$ meilleurs élèves en utilisant une stratégie de recherche séquentielle. Vous n'avez pas le droit de trier ni la liste ```nom``` ni la liste ```classement``` passées en paramètre. Vous avez par contre le droit d'en faire des copies et les modifier si vous le souhaitez.

## Question 2

Ecrivre une version ```meilleurs_v2(nom, classement, k)``` qui retourne une liste comportant les noms des $k$ meilleurs élèves. Vous utiliserez ici un algorithme de tri et vous ne pourrez pas faire de recherche dans les listes.

## Exercice 4



Dans la plupart des librairies modernes (par exemple la STL en C++), l'algorithme de tri implémenté est un algorithme hybride. Un tel algorithme repose sur un tri rapide. Cependant quand un critère est atteint (taille du tableau, profondeur de l'arbre de récurrence ...), on bascule sur un second algorithme de tri. Un exemple d'algorithme hybride est [introsort](https://en.wikipedia.org/wiki/Introsort). 

Implémentez un algorithme hybride basé sur le tri rapide mais qui utilise un tri par insertion quand la taille du tableau à trier est plus petit ou égal à 9 (ce nombre étant un choix arbitraire).

## Exercice 5

Modifiez vos algorithmes de tri par insertion et de tri rapide pour qu'ils retournent le nombre de comparaisons effectuées entre deux éléments de la liste à trier. Pour les deux algorithmes, vous utiiliserez une implémentation en place. L'algorithme le plus "rapide" sera celui qui fait le moins de comparaisons.

Utilisez le code ci-dessous pour comparer les performances de vos algorithmes pour plusieurs tailles de listes. Pour chaque taille, il s'agit d'une moyenne sur plussieurs listes. Quelle algorithme recommenderiez-vous ? (serez-vous capable de faire mieux que [Barack Obama](https://www.youtube.com/watch?v=koMpGeZpu4Q) ?)

In [None]:
from random import randint
import matplotlib.pyplot as plt

def tri_insertion(liste):
    return 0

def tri_rapide(liste, ind1, ind2):
    return 0

def évaluation(max_n):
    res_tri_insertion = []
    res_tri_rapide = []
    
    n = 10
    while n <= max_n:
        somme_tri_insertion = 0
        somme_tri_rapide = 0
        for k in range(10):
            l = [randint(1, 10*n) for _ in range(n)]
            somme_tri_insertion += tri_insertion(l)
            somme_tri_rapide += tri_rapide(l, 0, len(l))
        res_tri_insertion.append(somme_tri_insertion / 10)
        res_tri_rapide.append(somme_tri_rapide / 10)
        n *= 10
    
    return res_tri_insertion, res_tri_rapide

def comparaison(max_n):
    res_tri_insertion, res_tri_rapide = évaluation(max_n)
    abscisse = []
    n = 10
    while n <= max_n:
        abscisse.append(n)
        n *= 10
    
    plt.xlabel("Taille de la liste")
    plt.ylabel("Nbre de comparaisons")
    plt.plot(abscisse, res_tri_insertion, label="Tri par insertion")
    plt.plot(abscisse, res_tri_rapide, label="Tri rapide")
    plt.show()
    
comparaison(100000)