# Quicksort

In diesem Notebook schauen wir uns den Quicksort Algorithmus an.

### Quicksort

Der Kern vom Quicksort-Algorithmus ist die Partitionsfunktion, die die Elemente in einem Array so aufteilt, dass alle Elemente links von einem gewählten Pivotelement kleiner oder gleich diesem Element sind, und alle Elemente rechts davon grösser oder gleich dem Pivotelement. 

In [1]:
def partition(array, lo, hi):
    pivot = array[lo]
    i = lo + 1
    j = hi
    
    while (True):
        while i < hi and array[i] < pivot:
            i += 1
        
        while array[j] > pivot:
            j -= 1
        if i >= j:
            break
            
        array[i], array[j] = array[j], array[i]
        i, j = i + 1, j - 1

    array[lo], array[j] = array[j], array[lo]
    return j

In [2]:
array = [7, 3, 5, 7, 8, 2, 5, 6, 2, 8]
pivot_pos = partition(array, 0, len(array) -1)

print(array)

[5, 3, 5, 2, 6, 2, 7, 8, 7, 8]


Die eigentliche Sortierfunktion ist dann sehr einfach zu implementieren:

In [3]:
def quicksort(array):
    sort_aux(array, 0, len(array)-1)
    
def sort_aux(array, lo, hi):
    if hi <= lo:
        return
    # choose_pivot_and_swap_it_to_lo(array, lo, hi)
    pivot_pos = partition(array, lo, hi)
    sort_aux(array, lo, pivot_pos - 1)
    sort_aux(array, pivot_pos + 1, hi)

In [4]:
array = [4, 2, 5, 7, 9, 6, 4, 1]
quicksort(array)
print(array)

[1, 2, 4, 4, 5, 6, 7, 9]


#### Übung: 
Betrachten Sie Sequenz a = $\langle3, 7, 1, 7, 0, 3, 5, 4\rangle$.

1. Simulieren Sie den Aufruf von partition(a, 0, 7) und geben Sie jeweils den Stand des Arrays und der i- und j-Pointer nach Zeile 4, 9 und 14 an. Was ist der Rückgabewert und wie sieht die Sequenz zum Terminierungszeitpunkt aus?


2. Welche Eigenschaft sollte das Pivotelement allgemein günstigenfalls haben? Wählen Sie im folgenden das Pivotelement jeweils optimal, so dass die Anzahl der Aufrufe von sort_aux minimiert wird. Geben Sie die Aufrufe von sort_aux (jeweils mit dem Zustand des Arrays) an, wie sie in einem Durchlauf von sort(a) geschehen.

    Geben Sie jeweils an, welches Pivotelement gewählt wird. Bei gleich gut geeigneten Pivotelementen wählen Sie bitte immer die kleinere Zahl und bei gleichen Zahlen, das Element, das gerade weiter vorne in der Sequenz steht. Hinweis Vergessen Sie bitte nicht, dass das Pivotelement in Zeile 8 des Algorithmus an Position lo getauscht wird. Vergessen Sie auch nicht die rekursiven Aufrufe für leere und einelementige Bereiche. Wenn Sie alles richtig machen, sollten Sie insgesamt neun Aufrufe von sort_aux benötigen.


3. Was ist allgemein die schlechtestmöglichste Wahl für das Pivotelement? Geben Sie die ersten sieben Aufrufe von sort_aux für den Fall an, dass immer ein möglichst ungünstiges Pivotelement gewählt wird. Bei mehreren Kandidaten wählen Sie bitte wieder das erste. Erkennen Sie ein Muster? Wie viele Aufrufe wird Quicksort in diesem Fall insgesamt benötigen?


#### Lösung:

1. nach Zeile 4: $\langle 3, 7_i, 1, 7, 0, 3, 5, 4_j \rangle$
 
  nach Zeile 9: $\langle 3, 7_i, 1, 7, 0, 3_j, 5, 4 \rangle$
  
  nach Zeile 14: $\langle 3, 3, 1_i, 7, 0_j, 7, 5, 4 \rangle$
  
  nach Zeile 9: $\langle 3, 3, 1, 7_i, 0_j, 7, 5, 4 \rangle$
  
  nach Zeile 14: $\langle 3, 3, 1, 0_j, 7_i, 7, 5, 4 \rangle$
  
  

2. Die  Laufzeit  ist  am  besten,  wenn  das  Pivotelement  die  Sequenz  in  zwei  möglichst  gleichgrosse Teile teilt.

  * sort_aux([3, 7, 1, 7, 0, 3, 5, 4], 0, 7) (wähle Pivotelement 3)
  
  * sort_aux([0, 3, 1, 3, 7, 7, 5, 4], 0, 2) (wähle Pivotelement 1)
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 0, 0) 
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 2, 2) 
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 4, 7) (wähle Pivotelement 5)
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 4, 4) 
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 6, 7) (wähle Pivotelement 7)
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 6, 6) 
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 8, 7) 
  
  
  
3. Am ungünstigsten ist es, wenn immer das kleinste oder grösste Element gewählt wird. Die ersten sieben Aufrufe lauten:

  * sort_aux([3, 7, 1, 7, 0, 3, 5, 4], 0, 7) (wähle Pivotelement 0)
  
  * sort_aux([0, 7, 1, 7, 3, 3, 5, 4], 0, -1) 
  
  * sort_aux([0, 7, 1, 7, 3, 3, 5, 4], 1, 7) (wähle Pivotelement 1) 
  
  * sort_aux([0, 1, 7, 7, 3, 3, 5, 4], 1, 0) 
  
  * sort_aux([0, 1, 7, 7, 3, 3, 5, 4], 2, 7) (wähle Pivotelement 3)
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 2, 2) 
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 4, 7) (wähle Pivotelement 4)
  
    Nachdem wir das kleinste Element an die Position lo tauschen haben wir zwei Aufrufe, einen für den (leeren) Bereich von lo bis lo-1 und einen für den Bereich von lo+1 bis 7.
    
    Also für k = 0,...,7 je einen Aufruf von k bis 7 und für k = 0,...,6 je einen Aufruf von k bis k-1. Insgesamt sind dies 8 + 7 = 15 Aufrufe.

### Laufzeit Quicksort

#### Lösung:

1. nach Zeile 4: $\langle 3, 7_i, 1, 7, 0, 3, 5, 4_j \rangle$
 
  nach Zeile 9: $\langle 3, 7_i, 1, 7, 0, 3_j, 5, 4 \rangle$
  
  nach Zeile 14: $\langle 3, 3, 1_i, 7, 0_j, 7, 5, 4 \rangle$
  
  nach Zeile 9: $\langle 3, 3, 1, 7_i, 0_j, 7, 5, 4 \rangle$
  
  nach Zeile 14: $\langle 3, 3, 1, 0_j, 7_i, 7, 5, 4 \rangle$
  
  

2. Die  Laufzeit  ist  am  besten,  wenn  das  Pivotelement  die  Sequenz  in  zwei  möglichst  gleichgrosse Teile teilt.

  * sort_aux([3, 7, 1, 7, 0, 3, 5, 4], 0, 7) (wähle Pivotelement 3)
  
  * sort_aux([0, 3, 1, 3, 7, 7, 5, 4], 0, 2) (wähle Pivotelement 1)
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 0, 0) 
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 2, 2) 
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 4, 7) (wähle Pivotelement 5)
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 4, 4) 
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 6, 7) (wähle Pivotelement 7)
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 6, 6) 
  
  * sort_aux([0, 1, 3, 3, 4, 5, 7, 7], 8, 7) 
  
  
  
3. Am ungünstigsten ist es, wenn immer das kleinste oder grösste Element gewählt wird. Die ersten sieben Aufrufe lauten:

  * sort_aux([3, 7, 1, 7, 0, 3, 5, 4], 0, 7) (wähle Pivotelement 0)
  
  * sort_aux([0, 7, 1, 7, 3, 3, 5, 4], 0, -1) 
  
  * sort_aux([0, 7, 1, 7, 3, 3, 5, 4], 1, 7) (wähle Pivotelement 1) 
  
  * sort_aux([0, 1, 7, 7, 3, 3, 5, 4], 1, 0) 
  
  * sort_aux([0, 1, 7, 7, 3, 3, 5, 4], 2, 7) (wähle Pivotelement 3)
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 2, 2) 
  
  * sort_aux([0, 1, 3, 3, 7, 7, 5, 4], 4, 7) (wähle Pivotelement 4)
  
    Nachdem wir das kleinste Element an die Position lo tauschen haben wir zwei Aufrufe, einen für den (leeren) Bereich von lo bis lo-1 und einen für den Bereich von lo+1 bis 7.
    
    Also für k = 0,...,7 je einen Aufruf von k bis 7 und für k = 0,...,6 je einen Aufruf von k bis k-1. Insgesamt sind dies 8 + 7 = 15 Aufrufe.

### Laufzeit Quicksort

Auch hier wollen wir nun die Laufzeit vergleichen. 

In [5]:
import timeit
import random

In [6]:
def createRandArray(n):
    a = [0]*n
    for i in range(0, n):
        a[i] = random.randint(0, n)
    return a

In [7]:
for i in range (1, 7):
    a = createRandArray(10**i)
    t = timeit.timeit(lambda: quicksort(a), number=1)
    print("quicksort auf " +str(10**i) + " Elementen: " + str(t))

quicksort auf 10 Elementen: 8.19999999990273e-06
quicksort auf 100 Elementen: 8.06999999999336e-05
quicksort auf 1000 Elementen: 0.001129900000000017
quicksort auf 10000 Elementen: 0.015187300000000015
quicksort auf 100000 Elementen: 0.19423730000000006
quicksort auf 1000000 Elementen: 2.5341218


Auch hier sehen wir, dass die Laufzeit nur leicht überlinear ansteigt. Wir können mit quicksort sehr grosse Sequenzen effizient sortieren. 