# Quicksort

In diesem Notebook schauen wir uns den Quicksort Algorithmus an.

### Quicksort

Der Kern vom Quicksort-Algorithmus ist die Partitionsfunktion, die die Elemente in einem Array so aufteilt, dass alle Elemente links von einem gewählten Pivotelement kleiner oder gleich diesem Element sind, und alle Elemente rechts davon grösser oder gleich dem Pivotelement. 

In [1]:
def partition(array, lo, hi):
    pivot = array[lo]
    i = lo + 1
    j = hi
    while (True):
        #print("4: ", array, i, j)
        while i < hi and array[i] < pivot:
            i += 1
        
        while array[j] > pivot:
            j -= 1
        if i >= j:
            break

        #print("9: ", array, i, j)
    
        array[i], array[j] = array[j], array[i]
        i, j = i + 1, j - 1
        #print("14: ", array, i, j)
  
    array[lo], array[j] = array[j], array[lo]
    return j

In [2]:
array = [7, 3, 5, 7, 8, 2, 5, 6, 2, 8]
pivot_pos = partition(array, 0, len(array) -1)

print(array)

[5, 3, 5, 2, 6, 2, 7, 8, 7, 8]


Die eigentliche Sortierfunktion ist dann sehr einfach zu implementieren:

In [14]:
def quicksort(array):
    sort_aux(array, 0, len(array)-1)

def choose_pivot_and_swap_it_to_lo_worst_pivot(array, lo, hi):
    minval = min(array[lo:(hi + 1)])
    minpos = lo + array[lo:(hi + 1)].index(minval)
    array[lo], array[minpos] = array[minpos], array[lo]

    
def choose_pivot_and_swap_it_to_lo_best_pivot(array, lo, hi):
    sortedArray = sorted(array[lo:(hi + 1)])
    median = sortedArray[(len(sortedArray) - 1) // 2] 
    medianpos = lo + array[lo:(hi + 1)].index(median)
    array[lo], array[medianpos] = array[medianpos], array[lo]
        
    
def sort_aux(array, lo, hi):
    if hi <= lo:
        return
    pivot_pos = partition(array, lo, hi)
    sort_aux(array, lo, pivot_pos - 1)
    sort_aux(array, pivot_pos + 1, hi)

In [15]:
array = [9,7,1,12,0,3,5,4]
#partition(array, 0, 7)
quicksort(array)
print(array)

[0, 1, 3, 4, 5, 7, 9, 12]


In [16]:
a=[1,2, 3, 8, 9]
sorted(a)
a

[1, 2, 3, 8, 9]

#### Übung: 
Betrachten Sie Sequenz a = $\langle3, 7, 1, 7, 0, 3, 5, 4\rangle$.

1. Simulieren Sie den Aufruf von partition(a, 0, 7) und geben Sie jeweils den Stand des Arrays und der i- und j-Pointer nach Zeile 4, 9 und 14 an. Was ist der Rückgabewert und wie sieht die Sequenz zum Terminierungszeitpunkt aus?


2. Welche Eigenschaft sollte das Pivotelement allgemein günstigenfalls haben? Wählen Sie im folgenden das Pivotelement jeweils optimal, so dass die Anzahl der Aufrufe von sort_aux minimiert wird. Geben Sie die Aufrufe von sort_aux (jeweils mit dem Zustand des Arrays) an, wie sie in einem Durchlauf von sort(a) geschehen.

    Geben Sie jeweils an, welches Pivotelement gewählt wird. Bei gleich gut geeigneten Pivotelementen wählen Sie bitte immer die kleinere Zahl und bei gleichen Zahlen, das Element, das gerade weiter vorne in der Sequenz steht. Hinweis Vergessen Sie bitte nicht, dass das Pivotelement in Zeile 8 des Algorithmus an Position lo getauscht wird. Vergessen Sie auch nicht die rekursiven Aufrufe für leere und einelementige Bereiche. Wenn Sie alles richtig machen, sollten Sie insgesamt neun Aufrufe von sort_aux benötigen.


3. Was ist allgemein die schlechtestmöglichste Wahl für das Pivotelement? Geben Sie die ersten sieben Aufrufe von sort_aux für den Fall an, dass immer ein möglichst ungünstiges Pivotelement gewählt wird. Bei mehreren Kandidaten wählen Sie bitte wieder das erste. Erkennen Sie ein Muster? Wie viele Aufrufe wird Quicksort in diesem Fall insgesamt benötigen?


### Laufzeit Quicksort

Auch hier wollen wir nun die Laufzeit vergleichen. 

In [17]:
import timeit
import random

In [18]:
def createRandArray(n):
    a = [0]*n
    for i in range(0, n):
        a[i] = random.randint(0, n)
    return a

In [19]:
for i in range (1, 7):
    a = createRandArray(10**i)
    t = timeit.timeit(lambda: quicksort(a), number=1)
    print("quicksort auf " +str(10**i) + " Elementen: " + str(t))

quicksort auf 10 Elementen: 1.2717999993583362e-05
quicksort auf 100 Elementen: 0.0002346670000008544
quicksort auf 1000 Elementen: 0.003263997999994217
quicksort auf 10000 Elementen: 0.030059065000017426
quicksort auf 100000 Elementen: 0.2503584619999799
quicksort auf 1000000 Elementen: 3.4289237209999897


Auch hier sehen wir, dass die Laufzeit nur leicht überlinear ansteigt. Wir können mit quicksort sehr grosse Sequenzen effizient sortieren. 