# Quicksort

In diesem Notebook schauen wir uns den Quicksort Algorithmus an. Quicksort ist wie Mergesort ein Teile- und Herrsche-Algorithmus. Der Algorithmus wählt ein Pivotelement (Drehpunkt) aus und partioniert die Liste um das ausgewählte Pivotelement. Das Pivotelement kann auf unterschiedliche Weise ausgewählt werden. Z.B. kann immer das erste Element der Liste als Pivot, das letzte Element als Pivot, ein zufälliges Element als Pivot oder der Median als Pivot ausgewählt werden. Die durschnittliche Zeitkomplexität von Quicksort ist in O(n*log(n)). Der Worst-Case (O(n²)) würde dann eintreffen, wenn das Pivotelement immer das letzte Element der Liste ist und die Liste eigentlich schon sortiert wäre. Der Best-Case würde dann eintreffen, wenn das Pivotelement immer so gewählt wird, dass die Teillisten immer möglichst gleich gross sind und die Komplexität ist dann in O(n*log(n)). 

### Quicksort

Der Kern vom Quicksort-Algorithmus ist die Partitionsfunktion, die die Elemente in einem Array so aufteilt, dass alle Elemente links von einem gewählten Pivotelement kleiner oder gleich diesem Element sind, und alle Elemente rechts davon grösser oder gleich dem Pivotelement. 

In [1]:
def partition(array, lo, hi):
    pivot = array[lo]
    i = lo + 1
    j = hi
    print(f"Nach Zeile 4: {i=}, {j=}")
    
    while (True):
        while i < hi and array[i] < pivot:
            i += 1
            print(f"Nach Zeile 9: {i=}, {j=}")
        
        while array[j] > pivot:
            j -= 1
        if i >= j:
            break
            
        array[i], array[j] = array[j], array[i]
        i, j = i + 1, j - 1
        print(f"Nach Zeile 9: {i=}, {j=}")
        
    array[lo], array[j] = array[j], array[lo]
    return j

In [2]:
array = [3,7,1,7,0,3,5,4]
pivot_pos = partition(array, 0, len(array) -1)

print(pivot_pos)
print(array)
# vorsortieren um Pivot

Nach Zeile 4: i=1, j=7
Nach Zeile 9: i=2, j=4
Nach Zeile 9: i=3, j=4
Nach Zeile 9: i=4, j=3
3
[0, 3, 1, 3, 7, 7, 5, 4]


Die eigentliche Sortierfunktion ist dann sehr einfach zu implementieren:

In [12]:
def quicksort(array):
    sort_aux(array, 0, len(array)-1)
    
def sort_aux(array, lo, hi):
    if hi <= lo:
        return
    # choose_pivot_and_swap_it_to_lo(array, lo, hi)
    pivot_pos = partition(array, lo, hi)
    # pivot_pos = 1
    sort_aux(array, lo, pivot_pos - 1)
    sort_aux(array, pivot_pos + 1, hi)

In [None]:
array = [4, 2, 5, 7, 9, 6, 4, 1]
quicksort(array)
print(array)
print(pivot_pos)

#### Übung: 
Betrachten Sie Sequenz a = $\langle3, 7, 1, 7, 0, 3, 5, 4\rangle$.

1. Simulieren Sie den Aufruf von partition(a, 0, 7) und geben Sie jeweils den Stand des Arrays und der i- und j-Pointer nach Zeile 4, 9 und 14 an. Was ist der Rückgabewert und wie sieht die Sequenz zum Terminierungszeitpunkt aus?


2. Welche Eigenschaft sollte das Pivotelement allgemein günstigenfalls haben? Wählen Sie im folgenden das Pivotelement jeweils optimal, so dass die Anzahl der Aufrufe von sort_aux minimiert wird. Geben Sie die Aufrufe von sort_aux (jeweils mit dem Zustand des Arrays) an, wie sie in einem Durchlauf von sort(a) geschehen.

    Geben Sie jeweils an, welches Pivotelement gewählt wird. Bei gleich gut geeigneten Pivotelementen wählen Sie bitte immer die kleinere Zahl und bei gleichen Zahlen, das Element, das gerade weiter vorne in der Sequenz steht. Hinweis Vergessen Sie bitte nicht, dass das Pivotelement in Zeile 8 des Algorithmus an Position lo getauscht wird. Vergessen Sie auch nicht die rekursiven Aufrufe für leere und einelementige Bereiche. Wenn Sie alles richtig machen, sollten Sie insgesamt neun Aufrufe von sort_aux benötigen.


3. Was ist allgemein die schlechtestmöglichste Wahl für das Pivotelement? Geben Sie die ersten sieben Aufrufe von sort_aux für den Fall an, dass immer ein möglichst ungünstiges Pivotelement gewählt wird. Bei mehreren Kandidaten wählen Sie bitte wieder das erste. Erkennen Sie ein Muster? Wie viele Aufrufe wird Quicksort in diesem Fall insgesamt benötigen?


### Laufzeit Quicksort

Auch hier wollen wir nun die Laufzeit vergleichen. 

In [5]:
import timeit
import random

In [6]:
def createRandArray(n):
    a = [0]*n
    for i in range(0, n):
        a[i] = random.randint(0, n)
    return a

In [7]:
for i in range (1, 7):
    a = createRandArray(10**i)
    t = timeit.timeit(lambda: quicksort(a), number=1)
    print("quicksort auf " +str(10**i) + " Elementen: " + str(t))

quicksort auf 10 Elementen: 8.19999999990273e-06
quicksort auf 100 Elementen: 8.06999999999336e-05
quicksort auf 1000 Elementen: 0.001129900000000017
quicksort auf 10000 Elementen: 0.015187300000000015
quicksort auf 100000 Elementen: 0.19423730000000006
quicksort auf 1000000 Elementen: 2.5341218


Auch hier sehen wir, dass die Laufzeit nur leicht überlinear ansteigt. Wir können mit quicksort sehr grosse Sequenzen effizient sortieren. 