# Les algorithme de tri

Les algorithmes de tri sont nombreux. Chacun a son avantage et son inconvenient.</br>
Bien que leurs implémentation existent déjà, c'est toujour intéressant et pertinent de savoir comment ils fonctionnent.</br>
À travers ce notebook, nous allons aborder différent alorithme de tri (et même en implémenter hihihi)

### 1 - Le bubble sort

Le bubble sort ou tri à bulle est "un algorithme de tri. Il consiste à comparer répétitivement les éléments consécutifs d'un tableau, et à les permuter lorsqu'ils sont mal triés. Il doit son nom au fait qu'il déplace rapidement les plus grands éléments en fin de tableau, comme des bulles d'air qui remonteraient rapidement à la surface d'un liquide." ([wikipedia](https://fr.wikipedia.org/wiki/Tri_%C3%A0_bulles))</br>

Le fonctionnement, en pseudo-code est le suivant:</br>
```
tri_à_bulles(Tableau T)
   pour i allant de (taille de T)-1 à 1
       pour j allant de 0 à i-1
           si T[j+1] < T[j]
               (T[j+1], T[j]) ← (T[j], T[j+1])
```

In [8]:
def bubble_sort(array):
    for i in range(len(array)-1,1):
        for j in range(0,i-1):
            if array[j+1] < array[j]:
                array[j+1] = array[j]
                array[j] = array[j+1] 
    return array

In [9]:
bubble_sort([1,5,6,3,4,8,9,6,4,2,-4])

[1, 5, 6, 3, 4, 8, 9, 6, 4, 2, -4]

### 2 - Selection sort

Toujours d'après [wikipedia](https://fr.wikipedia.org/wiki/Tri_par_s%C3%A9lection), "Le tri par sélection (ou tri par extraction) est un algorithme de tri par comparaison. Cet algorithme est simple, mais considéré comme inefficace car il s'exécute en temps quadratique en fonction du nombre d'éléments à trier, et non en temps pseudo linéaire." (en gros, il est simple a faire mais est trèèèès lent)</br>

Le fonctionnement, en pseudo-code est le suivant:</br>
```  
  procédure tri_selection(tableau t)
      n ← longueur(t) 
      pour i de 0 à n - 2
          min ← i       
          pour j de i + 1 à n - 1
              si t[j] < t[min], alors min ← j
          fin pour
          si min ≠ i, alors échanger t[i] et t[min]
      fin pour
  fin procédure
 ```

In [15]:
def selection_sort(array):
    n = len(array)
    for i in range(n-2):
        min = i
        for j in range(i+1,n-1):
            if array[j] < array[min]:
                    min = j
        if min != i:
            array[i], array[min] = array[min], array[i]
                
    return array

In [16]:
selection_sort([1,5,6,3,4,8,9,6,4,2,-4])

[1, 2, 3, 4, 4, 5, 6, 6, 8, 9, -4]

### 3 - Insertion sort

Selon [wikipedia](https://fr.wikipedia.org/wiki/Tri_par_insertion) (pourquoi changer une équipe qui gagne ? hehe), "le tri par insertion est un algorithme de tri classique. La plupart des personnes l'utilisent naturellement pour trier des cartes à jouer.</br>

En général, le tri par insertion est beaucoup plus lent que d'autres algorithmes comme le tri rapide (ou quicksort) et le tri fusion pour traiter de grandes séquences, car sa complexité asymptotique est quadratique. "</br>

son fonctionnement en pseudo-code est le suivant :

```
procédure tri_insertion(tableau T)
  
       pour i de 1 à taille(T) - 1

            # mémoriser T[i] dans x
            x ← T[i]                            

            # décaler les éléments T[0]..T[i-1] qui sont plus grands que x, en partant de T[i-1]
            j ← i                               
            tant que j > 0 et T[j - 1] > x
                     T[j] ← T[j - 1]
                     j ← j - 1

            # placer x dans le "trou" laissé par le décalage
            T[j] ← x
```

In [17]:
def insertion_sort(array):
    for i in range(1,len(array)-1):
        
        x = array[i]

        j = i
        
        while j > 0 and array[j - 1] > x:
            array[j] = array[j - 1]
            j = j-1

        array[j] = x

    return array

In [18]:
insertion_sort([1,5,6,3,4,8,9,6,4,2,-4])

[1, 2, 3, 4, 4, 5, 6, 6, 8, 9, -4]

### 4 - Merge sort

On commence à connaitre la chanson, [wikipedia](https://fr.wikipedia.org/wiki/Tri_fusion) décrit le merge sort comme "un algorithme de tri par comparaison stable. Sa complexité temporelle pour une entrée de taille n est de l'ordre de n log n, ce qui est asymptotiquement optimal. Ce tri est basé sur la technique algorithmique diviser pour régner. L'opération principale de l'algorithme est la fusion, qui consiste à réunir deux listes triées en une seule. L'efficacité de l'algorithme vient du fait que deux listes triées peuvent être fusionnées en temps linéaire. "</br>

Le pseudo-code est en deux parties : un première fonction le tri est un autre pour la fusion
```
entrée : un tableau T
sortie : une permutation triée de T
fonction triFusion(T[1, …, n])
      si n ≤ 1
              renvoyer T
      sinon
              renvoyer fusion(triFusion(T[1, …, n/2]), triFusion(T[n/2 + 1, …, n]))

entrée : deux tableaux triés A et B
sortie : un tableau trié qui contient exactement les éléments des tableaux A et B
fonction fusion(A[1, …, a], B[1, …, b])
      si A est le tableau vide
              renvoyer B
      si B est le tableau vide
              renvoyer A
      si A[1] ≤ B[1]
              renvoyer A[1] ⊕ fusion(A[2, …, a], B)
      sinon
              renvoyer B[1] ⊕ fusion(A, B[2, …, b])

```

(je crois que le petit "⊕" veut dire concatener les listes...)

In [35]:
def merge(A, B):
    if A == []:
        return B
    if B == []:
        return A
    if A[0] < B[0]:
        return [A[0]] + merge(A[1:], B)
    else:
        return [B[0]] + merge(A, B[1:])

def merge_sort(array):
    n = len(array)
    if n <= 1:
        return array
    return merge(merge_sort(array[:n//2]), merge_sort(array[n//2:]))

In [36]:
merge_sort([1,5,6,3,4,8,9,6,4,2,-4])

[-4, 1, 2, 3, 4, 4, 5, 6, 6, 8, 9]

### 5 - Quick sort

Le quick sort est aussi basé la méthode de conception diviser pour régner. (cf [wikipedia](https://fr.wikipedia.org/wiki/Tri_rapide))</br>

On sélectionne un élément "pivot" dans le tableau et répartit les autres éléments en deux sous-ensembles, selon qu'ils sont inférieurs ou supérieurs à l'élément pivot.</br>

Le pseudo code fait peur mais rien de bien méchant :

```
partitionner(tableau T, entier premier, entier dernier, entier pivot)
    échanger T[pivot] et T[dernier]  // échange le pivot avec le dernier du tableau , le pivot devient le dernier du tableau
    j := premier
    pour i de premier à dernier - 1 // la boucle se termine quand i = (dernier élément du tableau).
        si T[i] <= T[dernier] alors
            échanger T[i] et T[j]
            j := j + 1
    échanger T[dernier] et T[j]
    renvoyer j

tri_rapide(tableau T, entier premier, entier dernier)
        si premier < dernier alors
            pivot := choix_pivot(T, premier, dernier)
            pivot := partitionner(T, premier, dernier, pivot)
            tri_rapide(T, premier, pivot-1)
            tri_rapide(T, pivot+1, dernier)
```

Dans la page française de wikipedia, on nous parle de choix du pivot. Pour ne pas s'embêter, nous allons faire comme la pange anglaise et prendre comme pivot le dernier element de la liste

In [3]:
def partition(array, lo, hi):
    pivot = array[hi]
    i = lo
    
    for j in range(lo, hi):
        if array[j] <= pivot:
            array[i], array[j] = array[j], array[i]
            i += 1
    array[i], array[hi] = array[hi], array[i]
    
    return i

def quicksort(array, lo, hi):
    if lo >= hi or lo < 0:
        return

    pivot = partition(array, lo, hi)

    quicksort(array, lo, pivot - 1)
    quicksort(array, pivot + 1, hi)
    
    return array
    

In [5]:
arr = [1,5,6,3,4,8,9,6,4,2,-4]
quicksort(arr, 0, len(arr) - 1)

[-4, 1, 2, 3, 4, 4, 5, 6, 6, 8, 9]

Pour aller plus loin ou pour "visualiser" le fonctionnement des différents algorithme, cette [vidéo](https://www.youtube.com/watch?v=kPRA0W1kECg) est pertinente</br>
Et notamment ceux implémentés dans ce notebook :</br>
* [bubble sort](https://youtu.be/kPRA0W1kECg?si=nXAx1Pl45vORod89&t=240)
* [selection sort](https://www.youtube.com/watch?v=kPRA0W1kECg)    
* [insertion sort](https://www.youtube.com/watch?v=kPRA0W1kECg&t=10s)
* [quick sort](https://www.youtube.com/watch?v=kPRA0W1kECg&t=38s)
* [merge sort](https://www.youtube.com/watch?v=kPRA0W1kECg&t=66s)
