##  Quick sort

Quick Sot est une autre manière de trier une liste en utilisant un pivot selectionné de manière aléatoire. C'est aussi un algorithme utilisant le paradigme diviser-pour-régner comme le tri par fusion. L'avantage de quick sort est qu'il existe une version de l'algorithme probabilistique.
Voici deux liens utiles pour comprendre son fonctionnement: https://fr.wikipedia.org/wiki/Tri_rapide, https://www.youtube.com/watch?v=xcyDSLSkb0k

*"La méthode consiste à placer un élément du tableau (appelé pivot) à sa place définitive, en permutant tous les éléments de telle sorte que tous ceux qui sont inférieurs au pivot soient à sa gauche et que tous ceux qui sont supérieurs au pivot soient à sa droite.
Cette opération s'appelle le partitionnement. Pour chacun des sous-tableaux, on définit un nouveau pivot et on répète l'opération de partitionnement. Ce processus est répété récursivement, jusqu'à ce que l'ensemble des éléments soit trié. "*


1) Ecrire la fonction partition qui prend en entrée la list et les bornes de la fénêtre. Partition retourne l'index de partition. Le pseudocode est disponible sur la page wiki si besoin.

In [18]:
def partition(L, low, high):
    i = low - 1     # index of smaller element 
    pivot = L[high]  # pivot 
    # pivot=randint(start,end)
    
    for j in range(low, high): 
        # If current element is smaller than or 
        # equal to pivot 
        if L[j] <= pivot: 
          
            # increment index of smaller element 
            i = i+1 
            L[i],L[j] = L[j],L[i] 
  
    L[i+1], L[high] = L[high], L[i+1] 
    return i+1 
    


2) Ecrire la fonction quick sort à l'aide de la fonction partition.

In [19]:
def quick_sort(L, low, high):
    if low < high: 
        # pi is partitioning index, arr[p] is now 
        # at right place 
        pi = partition(arr,low,high) 

        # Separately sort elements before 
        # partition and after partition 
        quick_sort(arr, low, pi-1) 
        quick_sort(arr, pi+1, high) 
    return arr

3) Nous allons maintenant comparer la complexié de quick sort par rapport au tri par fusion. Est ce que le randomized Quick sort est plus efficace ? Pour répondre à cette question etudier les cas moyens de quick sort et le pire cas pour Merge Sort. Voici le code de merge sort lancer le avec differents tableaux (tié, non-trié etc...). Que constatez-vous par rapport à quick sort ?
(l'utilisation au début de la cellule de **%time** sera utile ici)

In [20]:
def merge_sort(arr): 
    if len(arr) >1: 
        mid = len(arr)//2 #Finding the mid of the array 
        L = arr[:mid] # Dividing the array elements  
        R = arr[mid:] # into 2 halves 
  
        merge_sort(L) # Sorting the first half 
        merge_sort(R) # Sorting the second half 
  
        i = j = k = 0
          
        # Copy data to temp arrays L[] and R[] 
        while i < len(L) and j < len(R): 
            if L[i] < R[j]: 
                arr[k] = L[i] 
                i+=1
            else: 
                arr[k] = R[j] 
                j+=1
            k+=1
          
        # Checking if any element was left 
        while i < len(L): 
            arr[k] = L[i] 
            i+=1
            k+=1
          
        while j < len(R): 
            arr[k] = R[j] 
            j+=1
            k+=1
    return arr

In [21]:
%time
arr = [5, 8, 6, 18, 97, 56, 899, 17, 6, 18, 78, 28, 18, 27, 18]
print("Pour un tableau non trié merge sort: ", merge_sort(arr))
%time
arr = [5,8, 10, 13, 18, 29, 39, 56, 78, 78, 89, 90, 99, 120, 149]
print("Pour un tableau trié merge sort: ", merge_sort(arr))


CPU times: user 4 µs, sys: 1 µs, total: 5 µs
Wall time: 7.87 µs
Pour un tableau non trié merge sort:  [5, 6, 6, 8, 17, 18, 18, 18, 18, 27, 28, 56, 78, 97, 899]
CPU times: user 0 ns, sys: 4 µs, total: 4 µs
Wall time: 7.15 µs
Pour un tableau trié merge sort:  [5, 8, 10, 13, 18, 29, 39, 56, 78, 78, 89, 90, 99, 120, 149]


In [22]:
%time
arr = [5, 8, 6, 18, 97, 56, 899, 17, 6, 18, 78, 28, 18, 27, 18]
print("Pour un tableau non trié quick sort: ", quick_sort(arr, low=0, high=len(arr)-1))
%time
arr = [5,8, 10, 13, 18, 29, 39, 56, 78, 78, 89, 90, 99, 120, 149]
print("Pour un tableau trié quick sort: ", quick_sort(arr, low=0, high=len(arr)-1))


CPU times: user 4 µs, sys: 0 ns, total: 4 µs
Wall time: 9.06 µs
Pour un tableau non trié quick sort:  [5, 6, 6, 8, 17, 18, 18, 18, 18, 27, 28, 56, 78, 97, 899]
CPU times: user 11 µs, sys: 1 µs, total: 12 µs
Wall time: 16.7 µs
Pour un tableau trié quick sort:  [5, 8, 10, 13, 18, 29, 39, 56, 78, 78, 89, 90, 99, 120, 149]


4) Calculer la complexité de Quick sort, dans le meilleure des cas, le pire des cas et le cas moyen.

*Indication: pour calculer le meilleure et le pire des cas, réfléchisser au cas particuliers quand cela arrive. Pour le cas moyen, il y a différents manières de le résoudre soit utiliser une équation de récurrence (idéal pour les appels récursifs) soit exprimer une variable aléatoire de probabilité et calculer son espérance de la forme: $ E[X] = \sum_{i=0}^{n-1}\sum_{j=i+1}^{n} c_{i,j}$ où $c_{i, j} $ est une variable aléatoire binaire (prenant la valeur 0 si l'élément à la position i est comparé avec $x_j$)*

**Meilleur cas:** le meilleur cas arrive lorsque le pivot est choisi tel que la liste est toujours divisée par deux en proportion égale. Cela signifie que chaque appel récursif traite une liste dont la taille est réduite de moitié. Par conséquent, nous ne pouvons faire que des appels imbriqués $log_2(n)$ avant d’atteindre une liste de taille 1. Cela signifie que la profondeur de l’arborescence des appels est $log_2(n)$. Mais aucun appel au même niveau de l'arborescence des appels ne traite la même partie de la liste d'origine; ainsi, chaque niveau d'appels n'a besoin que de $O(n)$ fois dans son ensemble (chaque appel a un surcoût constant, mais puisqu'il n'y a que des appels $O(n)$ à chaque niveau, il est inclus dans le facteur $O(n)$). Le résultat est que l'algorithme utilise uniquement le temps $O(n log(n))$.  
**Pire des cas:** La partition la plus déséquilibrée se produit lorsque l’une des sous-listes renvoyées par la routine de partitionnement est de taille n-1. Cela peut se produire si le pivot est l’élément le plus petit ou le plus grand de la liste. Si cela se produit de manière répétée dans chaque partition, chaque appel récursif traite une liste de taille inférieure à la liste précédente. Par conséquent, nous pouvons faire $n - 1$ appels imbriqués avant d’atteindre une liste de taille 1. Cela signifie que l’arborescence des appels est une chaîne linéaire de $n - 1$ appels imbriqués. Le $i^{ème}$ appel fonctionne $O(n - i)$ pour créer la partition et $\sum_{i=0}^n (n - i) = O (n^2)$, donc dans ce cas Quicksort prend $O(n^2)$.
**Cas moyen:** Utiliser l'équation $T(n) = 0(1) + O(n) + 2T(n/2)$ ce qui conduit à une division par deux de l'espace dans la fonction quick_sort avec les appels récursifs et $0(n)$ pour la fonction partition ou $E[X] = \sum_{i=0}^{n-1}\sum_{j=i+1}^{n} c_{i,j} = \sum_{i=0}^{n-1}\sum_{j=i+1}^{n} \frac{2}{j+1} = O(\sum_{i=0}^{n-1}log(i)) = O(nlog(n))$