# Sortieralgorithmen

Zu jedem Sortieralgorithmus habe ich euch noch eine kleine 'Visualisierung' gecodet.
Dabei wird gezeigt, was in welcher Iteration (meistens der äußeren Schleife) passiert.
Ihr aktiviert die Visualisierung, in dem ihr unter dem jeweiligen Algo das visual-Flag auf true
setzt.

In [1]:
def sort(algo, algov, sentence = "sorting", visual=False):
    """
        Selects between the standard sorting algorithm and a given
        visual version.
        
        Args:
            algo (function) : a sorting algorithm
            algov (function): visualized sorting algorithm
            sentence (str)  : a string to sort
            visual (bool)   : True if u want to see the visual algorithm
    """
    li = list(sentence)
    print('Before sort: "%s"' % sentence)
    
    # select visual or non visual algorithm
    # r is None for in-place algos
    r = algov(li) if visual else algo(li)
        
    print('After sort : "%s"' % ''.join(li if r is None else r))

### Anzahl der Vergleiche
Wir benutzen die Anzahl der Vergleiche um Sortieralgorithmen zu vergleichen, dabei unterscheiden wir in der Regel 
<b><u>worst case</u></b>, <b><u>average case</u></b> und <b><u>best case</u></b>

## Selectionsort

Die Grundidee hier ist, dass wir durch alle Elemente der Liste iterieren und für jedes Elemente suchen wir das kleinste
Element in der Restliste. Die Suche läuft dabei bis zum Ende durch, da wir nie sicher sein können,
dass einen Schritt weiter nicht noch ein kleineres Element kommt. Nach der inneren Schleife tauschen wir das aktuell
kleinste nach vorne und bewegen uns nach vorne.
Links von i ist somit eine 'fertig'-sortierte Teilliste rechts eine unsortierte Restliste.

Wir selektieren also immer das aktuelle Minimum der rechten Teilliste und bewegen es in ihr an die vorderste Position.
Danach verringern wir die rechte Teilliste um 1 von links.

In [2]:
def selectionsort(a):
    N = len(a)
    for i in range(N):
        minimum = i
        for k in range(i + 1, N):
            if a[k] < a[minimum]:
                minimum = k
        a[i], a[minimum] = a[minimum], a[i]

### Komplexitätsanalyse
Bei Bubblesort, Insertionsort und Selectionsort ist in der Regel eine Herleitung über die iterativen Eigenschaften kürzer.
Ich persönliche fine die rekursiven etwas schöner, dennoch will ich euch die iterativen nicht vorenthalten.
### Herleitung mit Rekursion
Das erste was bei Selectionsort auffällt, ist, dass die innere Schleife immer bis zum Ende aufgeführt wird. Worst, Avg und
Best case fallen somit zusammen.<br>
Sei $T(N)$ die Anzahl der Vergleiche für N Eingabeelemente, so ist $T(N)$ für Selectionsort:<br>
<br>$ T(N) = (N - 1) + T(N - 1) $<br>
Für $T(N-1)$ kennen wir aber somit auch schon die Anzahl der Vergleiche:<br>
<br>$ T(N) = (N - 1) + (N - 2) + T(N - 2) $<br>
Das setzt sich jetzt so fort ... aber wie lange? Sobald wir $T(N - (N - 1))$ haben, müssen wir uns überlegen was mit der
inneren Schleife passiert. Diese wird dann aber gar nicht mehr ausgeführt, also gilt $T(1) = 0$.<br>
<br>$ T(N) = (N - 1) + (N - 2) + (N - 3) + ... + 2 + 1 + 0 $<br>
Mit der Gauß'schen Summenformel:<br>
<br>$ T(N) = \frac{N * (N - 1)}{2} = O(N^{2})$<br>
### Herleitung durch Iteration
Man erkennt, dass die äußere Schleife N-Mal ausgeführt wird, wir erwarten also eine Summe mit N-Gliedern. Das erste Glied
repräsentiert die innere Schleife für i = 0, sie wird also (N-1)-Mal ausgeführt, danach (N-2)-Mal und so weiter, bis die
innere Schleife keinmal mehr durchlaufen wird. Daraus ergibt sich:
<br>$ T(N) = (N - 1) + (N - 2) + ... + 2 + 1 + 0 $ <br>
Mit Gauß'scher Summenformel:<br>
<br>$ T(N) = \frac{N * (N - 1)}{2} = O(N^{2})$<br>

In [3]:
def selectionsort_visual(a):
    from time import sleep
    N = len(a)
    for i in range(N):
        minimum = i
        for k in range(i + 1, N):
            if a[k] < a[minimum]:
                minimum = k
        print(''.join(a))
        s = list(' ' * N)
        s[i], s[minimum] = 'i', 'm'
        s = ''.join(s)
        print(s)
        sleep(2)
        print(' ' * N)
        a[i], a[minimum] = a[minimum], a[i]

In [4]:
sort(selectionsort, selectionsort_visual, visual = False)
print()
sort(selectionsort, selectionsort_visual, sentence = "0123456789", visual = False)
print()
sort(selectionsort, selectionsort_visual, sentence = "9876543210", visual = False)
print()
sort(selectionsort, selectionsort_visual, sentence = "0193284765", visual = False)

Before sort: "sorting"
After sort : "ginorst"

Before sort: "0123456789"
After sort : "0123456789"

Before sort: "9876543210"
After sort : "0123456789"

Before sort: "0193284765"
After sort : "0123456789"


## Insertionsort

Ähnlich wie Selectionsort haben wir eine äußere und eine innere Schleife, der Ansatz ist aber ein anderer. Der Algorithmus 
vergleich immer von der aktuellen Position i mit allen vorherigen und sucht nach einer Lücke die er das Element einfügen
kann. Das Element wird zu dieser Lücke nach vorne getragen. Auch hier befindet sich somit eine Trennung von schon sortierter
Liste und unsortiertem Rest. Im Gegensatz zu Selectionsort kann sich dieser rechte Teil noch ändern, weil im avg case 
ständig Elemente in die rechte Seite eingefügt werden.
Die innere Schleife läuft von i nach 0, bei Selectionsort lief sie nach hinten zu N.

In [5]:
def insertionsort(a):
    N = len(a)
    for i in range(1, N):
        cur, k = a[i], i
        while k > 0:
            if cur < a[k - 1]:
                a[k] = a[k - 1]
            else:
                break
            k -= 1
            a[k] = cur
            

### Komplexitätsanalyse
Auch bei Insertionsort haben wir 2 Schleifen, anders aber als bei Selectionsort enthält die innere Schleife eine Bedingung,
die zum schnelleren Verlassen der Schleife führen kann. Eine Unterscheidung in best, worst und avg case ist notwenig.
### Herleitung mit Rekursion
<b><u>Worst case</u></b><br>
Die Bedingung in der inneren Schleife wird immer ausgeführt. Dies führt in der ersten Iteration dazu, dass die innere 
Schleife exakt einmal durchlaufen wird. Es ergibt sich:
<br>$ T(N) = 1 + T(N - 1) $<br>
Im nächsten Durchlauf wird die innere Schleife zweimal ausgeführt:
<br>$ T(N) = 1 + 2 + T(N - 2) $<br>
Dies passiert bis die äußere Schleife auf N-1 steht, auch hier muss alles Durchlaufen werden:
<br>$ T(N) = 1 + 2 + ...  + T(N - (N - 1)) $<br>
Hier ist $T(1) = N - 1$:<br>
<br>$ T(N) = 1 + 2 + ... + (N - 2) + (N - 1) $<br>
Mit der Gauß'schen Summenformel:<br>
<br>$ T(N) = \frac{N * (N - 1)}{2} = O(N^{2})$<br>

<b><u>Best case</u></b><br>
Die Bedingung in der inneren Schleife wird nur einmal ausgeführt und evaluiert zu false, was zur Folge hat, dass die 
Schleife direkt breakt. Daraus ergibt sich für die erste Iteration:<br>
<br>$ T(N) = 1 + T(N - 1) $<br>
Wie schon oben erwähnt gilt für jede weiter Iteration auch, dass die Schleife nur einmal durchlaufen wird. Dies sitzt sich
fort bis zu $ T(1) = 1$, da die äußere Schleife bei 1 startet, gibt es $N-1$ Summanden<br>
<br>$ T(N) = \underbrace{1 + 1 + ... + 1 + 1}_{(N-1)-Mal} = N-1 = O(N) $<br>

<b><u>Average case</u></b><br>
Hier muss man abschätzen, wie oft die if-Bedingung ausgeführt wird. Im Mittel wird die Lücke immer genau in der Mitte liegen
somit ergibt sich die erste Iteration zu:<br>
<br>$ T(N) = \frac{1}{2} 1 + T(N - 1) $<br>
Die nächste Iteration sieht dann wie folgt aus (beachtet, dass ihr wir das einhalb nicht ausmultiplizieren, da wir es gleich
ausklammern wollen):<br>
<br>$ T(N) = \frac{1}{2} 1 + \frac{1}{2} 2 + T(N - 2) $<br>
Dies setzt sich wie im worst case bereits erklärt fort zu:
<br>$ T(N) = \frac{1}{2} 1 + \frac{1}{2} 2 + ... + \frac{1}{2} (N - 2) + \frac{1}{2} (N - 1) $<br>
Gauß'sche Summenformel:<br>
<br>$ T(N) = \frac{1}{2} \frac{N * (N - 1)}{2} = O(N^{2})$<br>

### Herleitung durch Iteration
<b><u>Worst case</u></b><br>
Die äußere Schleife wird $N-1$-Mal ausgeführt, es gibt also genauso viele Summanden in unserer Ergebnisformel. Die innere 
Schleife muss also aufsteigend von 1 bis $N-1$ ausgeführt werden, da sie maximale Durchläufe hat. Es ergibt sich folgende 
Summe:<br>
<br>$ T(N) = 1 + 2 + ... + (N - 2) + (N - 1) $<br>
Mit der Gauß'schen Summenformel:<br>
<br>$ T(N) = \frac{N * (N - 1)}{2} = O(N^{2})$<br>

<b><u>Best case</u></b><br>
Die äußere Schleife wird $N-1$-Mal ausgeführt, es gibt also genauso viele Summanden in unserer Ergebnisformel. Die innere 
Schleife wird immer direkt nach einer Abfrage abgebrochen - es gibt nur einen Vergleich pro Iteration.
<br>$ T(N) = \underbrace{1 + 1 + ... + 1 + 1}_{(N-1)-Mal} = N-1 = O(N) $<br>

<b><u>Average case</u></b><br>
Die äußere Schleife wird $N-1$-Mal ausgeführt -  genau wie im worstcase wird die innere Schleife öfter ausgeführt - im 
Schnitt im zur Hälfte zwischen aktueller Position und Start. Jeder Summand aus dem worstcase wird also mit $\frac{1}{2}$
multipliziert. Vereinfacht mit Gauß ergibt sich:<br>
<br>$ T(N) = \frac{1}{2} \frac{N * (N - 1)}{2} = O(N^{2})$<br>

In [6]:
def insertionsort_visual(a):
    from time import sleep
    N = len(a)
    digits = len(str(N))
    for i in range(1, N):
        print(str(i).zfill(digits), ''.join(a))
        cur, k = a[i], i
        while k > 0:
            print(' ' * digits, 'k:=' + str(k).zfill(digits), ''.join(a))
            if cur < a[k - 1]:
                a[k] = a[k - 1]
            else:
                break
            k -= 1
            a[k] = cur
        sleep(2)

In [7]:
sort(insertionsort, insertionsort_visual, visual = False)
print()
sort(insertionsort, insertionsort_visual, sentence = "0123456789", visual = False)
print()
sort(insertionsort, insertionsort_visual, sentence = "9876543210", visual = False)
print()
sort(insertionsort, insertionsort_visual, sentence = "0193284765", visual = False)

Before sort: "sorting"
After sort : "ginorst"

Before sort: "0123456789"
After sort : "0123456789"

Before sort: "9876543210"
After sort : "0123456789"

Before sort: "0193284765"
After sort : "0123456789"


## Bubblesort

Bubblesort ist wohl einer der naivsten Sortieralgorithmen. Wenn die Aufgabe lautet "Sortiere die Liste aufsteigend", dann 
ist der einfachste Ansatz wohl:"Suche das aktuell größte Element in der Liste und schiebe es an das Ende der Liste".
Genau das macht Bubblesort, die Elemente steigen wie Blasen auf.<br>
Bubblesort ist ähnlich zu Selectionsort, nur dass hier die rechte Teilliste die schon fertig sortierte ist.

In [8]:
def bubblesort(a):
    for i in range(len(a), 0, -1):
        for j in range(0, i - 1):
            if a[j] > a[j + 1]:
                a[j], a[j + 1] = a[j + 1], a[j]

### Komplexitätsanalyse
Genau wie bei Selectionsort wird die innere Schleife durch keine Bedingung frühzeitig verlassen - worst, avg und best case 
fallen somit zusammen.<br>
Die Herleitung läuft im Endeffekt analog und ihr werdet wieder auf $T(N) = O(N^{2}) $ stoßen.

In [9]:
def bubblesort_visual(a):
    from time import sleep
    N = len(a)
    
    for i in range(N, 0, -1):
        for j in range(0, i - 1):
            if a[j] > a[j + 1]:
                a[j], a[j + 1] = a[j + 1], a[j]
        print(''.join(a))
        s = list(' ' * N) + [' ']
        s[i] = '^'
        s = ''.join(s)
        print(s)
        sleep(2)
        print(' ' * N)

In [10]:
sort(bubblesort, bubblesort_visual, visual = False)
print()
sort(bubblesort, bubblesort_visual, sentence = "0123456789", visual = False)
print()
sort(bubblesort, bubblesort_visual, sentence = "9876543210", visual = False)
print()
sort(bubblesort, bubblesort_visual, sentence = "0193284765", visual = False)

Before sort: "sorting"
After sort : "ginorst"

Before sort: "0123456789"
After sort : "0123456789"

Before sort: "9876543210"
After sort : "0123456789"

Before sort: "0193284765"
After sort : "0123456789"


## Mergesort

Die bisherigen Sortieralgorithmen waren alle in ihrem vorgehen iterativ. Das schnellste bisher war $ O(N) $ in einem best,
case meistens aber eher $O(N^{2})$. Die Idee wie man das ganze noch besser hinbekommt ist folgende:
Man nutzt die Eigenschaft aus, dass kleine Listen sich besser sortieren lassen als große und entwickelt einen Algorithmus,
der eine große Liste in zwei kleinere zerteilt, diese seperat sortiert und danach wieder zusammengefügt.
Dafür definieren wir zwei Funktionen <i>mergesort</i>, diese Funktion sortiert eine gegebene Liste, in dem sie 
die Listen aufteilt, sich einmal mit der linken und dann mit der rechten selbst aufruft und diese sortiert.
Am Ende wird die zusammengefügte Ergebnisliste zurückgegeben. Hier sehen wir eine Neueiheit - die Eingabeliste wird nicht
direkt modifiziert sondern es gibt eine zusätzliche Liste.<br>
Sortieralgorithmen die eine Liste direkt ändern, nennen wir <b>in-place</b> ansonsten <b>out-of-place</b> oder <b>nicht in-
place</b> (ich weiß nicht ob es eine offizielle Formulierung dafür gibt)<br>
Damit die Rekursion in <i>mergesort</i> zu einem Ende kommt, brauchen wir eine Abbruchbedingung, deswegen definieren wir: Eine Liste mit maximal einem Element ist bereits sortiert. Bleibt nur noch die <i>merge</i>-Funktion, die zwei sortierte Teillisten zusammenfügt. Hierbei ist das Vorgehen so, dass immer das kleinste Element aus beiden Listen in die Ergebnisliste 
hinzugefügt wird. Sobald eine Liste vollständig hinzugefügt wurde, wird die restliche verebleibende Liste einfach komplett 
angefügt.<br>
Algorithmen die ein Vorgehen in dieser Form aufweisen folgen dem <b>"Divide and Conquer"</b>-Prinzip. Diese Algorithmen
machen sich zu Nutze, dass die Tiefe des Baumes den sie erzeugen gering ist und ihr Aufwand maßgeblich durch diese 
beeinflusst wird.

In [1]:
def mergesort(a):
    N = len(a)
    if N <= 1:
        return a
    else:
        left, right = a[0 : N//2], a[N//2 : N]
        left_sorted, right_sorted = mergesort(left), mergesort(right)
        return merge(left_sorted, right_sorted)


def merge(left, right):
    res = []
    while left and right:
        if left[0] < right[0]:
            res.append(left.pop(0))
        else:
            res.append(right.pop(0))
    while left:
        res.append(left.pop(0))
    while right:
        res.append(right.pop(0))
    return res


a = list("0123456789")
mergesort(a)
print(a)

a = [int(x) for x in a]
mergesort(a)
print(a)

'''
def merge(left, right):
    res = []
    l, r = 0, 0
    while l < len(left) and r < len(right):
        if left[l] < right[r]:
            res.append(left[l])
            l += 1
        else:
            res.append(right[r])
            r += 1
    while l < len(left):
        res.append(left[l])
        l += 1
    while r < len(right):
        res.append(right[r])
        r += 1
    return res
'''

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


'\ndef merge(left, right):\n    res = []\n    l, r = 0, 0\n    while l < len(left) and r < len(right):\n        if left[l] < right[r]:\n            res.append(left[l])\n            l += 1\n        else:\n            res.append(right[r])\n            r += 1\n    while l < len(left):\n        res.append(left[l])\n        l += 1\n    while r < len(right):\n        res.append(right[r])\n        r += 1\n    return res\n'

In [12]:
def mergesort(a):
    n = len(a)
    tmp = a[:]
    merge_recursive(a, 0, n, tmp)
    
def merge_recursive(a, start, end, tmp):
    if end - start > 1:
        middle = start + (end - start) // 2
        merge_recursive(a, start, middle, tmp)
        merge_recursive(a, middle, end, tmp)
        pos = start
        i = start
        j = middle
        while pos < end:
            if i < middle and (j == end or a[i] < a[j]):
                tmp[pos] = a[i]
                pos += 1
                i += 1
            else:
                tmp[pos] = a[j]
                pos += 1
                j += 1
                
        for i in range(end):
            a[i] = tmp[i]
            
a = list("0123456789")
mergesort(a)
print(a)

a = [int(x) for x in a]
mergesort(a)
print(a)

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### Komplexitätsanalyse
Da Mergesort ein rekursiver Algorithmus, können wir die Anzahl der Vergleiche nur mit einer Rekursionsformel herleiten.
Die Anzahl der Vergleiche für die Eingabegröße N setzt sich die Anzahl der Vergleich zusammen aus Kosten linke Seite 
sortieren & rechte Seite sortieren und beide Seiten zusammenfügen. Je nachdem wie oft wir im merge-Durchlauf die obere 
Schleife ausführen müssen ändert sich der Anteil des mergens. Im optimalen Fall sind beide Listen so sortiert, dass erst
die eine komplett zum Ergebnis hinzugefügt werden kann und dann die andere, somit brauchen wir $\frac{1}{2}N$ Vergleiche.
Im worst case müssen wir in der oberen Schleife N Vergleiche durchführen (die Bedingungen werden abwechselnd wahr).
#### Best case
$ T(N) = T(\lfloor\frac{1}{2}N\rfloor) + T(\lceil\frac{1}{2}N\rceil) + \frac{N}{2}$<br>
Wir treffen nun die Annahme dass die beiden Hälften genau gleichgroß sind und das Abrunden/Aufrunden nicht nötig sind.
Dadurch vereinfacht sich die Formel zu:
<br>$ T(N) = 2 * T(\frac{1}{2}) + \frac{N}{2}$<br>
In der nächsten Schicht des Baumes / für 2 * $T(\frac{1}{2})$ hat jeder Aufruf von merge_sort nur noch ein Viertel der
Gesamteingabeliste, dafür gibt es vier Aufrufe und einen weiteren merge.
<br>$ T(N) = 4 * T(\frac{1}{4}) + \frac{N}{2} + \frac{N}{2}$<br>
$ T(N) = 8 * T(\frac{1}{8}) + \frac{N}{2} + \frac{N}{2} + \frac{N}{2}$<br>
...<br>
$ T(N) = c * T(\frac{1}{c}) + \underbrace{\frac{N}{2} + ... + \frac{N}{2}}_{m-Mal}$<br>
m ist hierbei die Tiefe des Baums - wie wir nch sehen werden begträgt diese $m = \log_{2}{N}$<br>
Somit ergibt sich für den hinteren Teil der Formel $\frac{1}{2} N \log_{2}{N}$, die linke Seite wird zu 0, da in der letzten
Schicht nur noch aus den ein-elementigen Listen besteht, dafür sind keine Vergleiche notwendig.
$T(N) = c * \underbrace{T(\frac{1}{c})}_{= 0} + \underbrace{\frac{N}{2} + ... + \frac{N}{2}}_{\frac{1}{2} N \log_{2}{N}}$<br>
$T(N) = O(\frac{1}{2} N \log_{2}{N}) = O(N \log_{2}{N})$
#### Worst case
Das einzige was sich hier ändert ist der Summand der durch merge immer wieder dazu kommt. Somit fällt nur der Vorfaktor
$\frac{1}{2}$ weg. Also selbst im worst case hat Mergesort eine Komplexität von $O(N \log_{2}{N})$

In [13]:
def mergesort_visual(a):
    from time import sleep
    print("mergesort", ''.join(a))
    N = len(a)
    if N <= 1:
        sleep(2)
        return a
    else:
        left, right = a[0 : N//2], a[N//2 : N]
        left_sorted, right_sorted = mergesort_visual(left), mergesort_visual(right)
        sleep(2)
        return merge_visual(left_sorted, right_sorted)
    
def merge_visual(left, right):
    from time import sleep
    print("merge", ''.join(left), ''.join(right))
    res = []
    l, r = 0, 0
    while l < len(left) and r < len(right):
        if left[l] < right[r]:
            res.append(left[l])
            l += 1
        else:
            res.append(right[r])
            r += 1
    while l < len(left):
        res.append(left[l])
        l += 1
    while r < len(right):
        res.append(right[r])
        r += 1
    sleep(1)
    return res

In [14]:
sort(mergesort, mergesort_visual, visual = False)
print()
sort(mergesort, mergesort_visual, sentence = "0123456789", visual = False)
print()
sort(mergesort, mergesort_visual, sentence = "9876543210", visual = False)
print()
sort(mergesort, mergesort_visual, sentence = "0193284765", visual = False)

Before sort: "sorting"
After sort : "ginorst"

Before sort: "0123456789"
After sort : "0123456789"

Before sort: "9876543210"
After sort : "0123456789"

Before sort: "0193284765"
After sort : "0123456789"


## Quicksort

Ich weiß leider nicht, ob das die Implementierung ist, die ihr in der Vorlesung sehen werdet, so habe ich sie kennengelerent, das Prinzip bleibt ja aber das selbe.
Wir haben 3 Funktionen, wobei <i>quicksort</i> nur <i>quicksort_impl</i> mit dem gesamten Bereich der Liste aufruft.
Der Grundablauf von Quicksort sieht man in <i>quicksort_impl</i>, diese Funktion sortiert die Liste im übergebenen
Bereich l bis r, wobei l und r inklusive sind. Sollte r <= l sein, so hat der Listenabschnitt max 1 Element und wie bei
Mergesort gilt dann, dass die Liste schon sortiert ist.<br>
<br>
Falls r > l gibt es noch Elemente zu sortieren: partition sorgt dafür, dass links des <b>Pivot</b> alle Elemente kleiner
sind als dieses und rechts von ihm alle größer. Danach wird zuerst die linke Teilliste sortiert und danach die rechte.
Das ist der Hauptunterschied zu Mergesort, Mergesort führt erst die Rekursion aus und ruft dann eine Hilfsfunktion auf
und Quicksort nutzt erst die Hilfsfunktion und führt dann die Rekursion durch.<br>
<br>
Nun aber zum Herzstück von Quicksort <i>partition</i>. Zuerst wird das Pivotelement gewählt, dies ist hier willkürlich der
rechte Rand (normalerweise versucht man das Pivot eher random zu wählen). Die Wahl eines guten Pivots kann den Algorithmus
maßgeblich beschleunigen. Als nächstes werden zwei Laufvariablen definiert die einmal von links und einmal von rechts erstellt. Wir suchen dann von links das Element, welches größer ist als unser pivot und von rechts das, was kleiner
ist. Diese müssen wir dann vertauschen. Wenn i und j sich durchkreuzt haben sind wir fertig, wir müssen nur noch
das Pivot an seine endgültige Position bewegen, da wir danach nur noch die Liste links und die rechts vom Pivot sortieren.
Am Ende geben wir die Position des Pivotelements zurück um die nächsten Teillisten zu bestimmen.

In [15]:
def quicksort(a):
    quicksort_impl(a, 0, len(a) - 1)
    
def quicksort_impl(a, l, r):
    if r > l: # if r <= l everything is sorted -> list has zero to one elements
        i = partition(a, l, r)
        quicksort_impl(a, l, i - 1)
        quicksort_impl(a, i + 1, r)
    
def partition(a, l, r):
    """
        This is the core of quicksort - a good pivot element can
        speed up the whole process, a bad one will slow it down.
        Here we will sort everything according to the selected pivot.
        Everything left of the pivot should be less of the pivor,
        everything on the right bigger.
    """
    pivot = a[l] # pivot is now the right end - in most cases this is not perfect
    i, j = l + 1, r
    while True:
        # search from left. find first element bigger than pivot
        while i < r and a[i] <= pivot:
            i += 1
        # search from right. find first element smaller than pivot
        while j > l and a[j] >= pivot:
            j -= 1
            
        if j <= i: # index of the left side is now on the right side
            break  # everything on the left side is smaller and on the
                   # right side bigger than pivot
        a[i], a[j] = a[j], a[i] # swap out of order elements
        
    # because of a[i] >= pivot must the final position of a[i] on the rightside
    # of the pivot, and because a[j] <= pivot and i >= j is i the final position
    # of the pivot element
    #a[r] = a[i]
    #a[i] = pivot # move pivot to its position
    a[l], a[j] = a[j], a[l]
    return j

a = list("465442728718")
quicksort(a)
print(a)


['1', '2', '2', '4', '4', '4', '5', '6', '7', '7', '8', '8']


### Komplexitätsanalyse
Wie oben schon erwähnt, kann die Wahl des Pivots entscheidend sein, der worst case ist wenn das Pivot nach <i>partition</i> 
immer am Rand liegt, der best case, wenn es exakt in der Mitte liegt.
### Worst case
Wenn das Pivot nach <i>partition</i> immer am Rand liegt haben wir eine leere Teilliste und eine mit $N - 1$ Elementen, dazu
kommen die bisherigen N Vergleiche um die ganze Liste zu scannen und einen extra, weil die Laufvariablen sich überholen.
<br>$T(N) = \underbrace{T(0)}_{=0} + \underbrace{T(N - 1)}_{=T(N - 2) + N} + N + 1 $<br>
Auch hier werden wir wieder auf eine Summe geführt:
<br>$T(N) = 1 + ... + (N + 1) = \frac{(N + 1) * (N + 2)}{2} = O(N^{2}) $<br>
Damit ist Quicksort im worstcase langsamer als Insertionsort, obwohl sie in der selben Komplexitätsklasse liegen.
### Best case
Im best case teilt <i>partition</i> die Liste in zwei gleich große Hälften, es ergibt sich somit:
<br>$T(N) = 2 * T(\frac{N}{2}) + N + 1$<br>
Wir sehen wir kommen auf eine ähnliche Formel wie bereits bei Mergesort, es ergibt sich somit, dass Quicksort im best case
auch in $O(N \log_{2}{N})$ liegt - Quicksort ist zu dem in-place, da immer die originale Liste modifiziert wird.

In [16]:
def quicksort_visual(a):
    quicksort_impl_visual(a, 0, len(a) - 1)
    
def quicksort_impl_visual(a, l, r):
    print("quicksort", l, r)
    from time import sleep
    if r > l: # if r <= l everything is sorted -> list has zero to one elements
        k = partition_visual(a, l, r)
        sleep(1)
        quicksort_impl_visual(a, l, k - 1) # sort left side of the pivot
        sleep(1)
        quicksort_impl_visual(a, k + 1, r) # sort right side of the pivot
        sleep(1)
    
def partition_visual(a, l, r):
    from time import sleep
    pivot = a[r]
    i, j = l, r - 1
    while True:
        while i < r and a[i] <= pivot:
            i += 1
        while j > l and a[j] >= pivot:
            j -= 1
        
        print('    ' + ''.join(a) + ' ')
        s = list('    ' + ' ' * len(a) + ' ')
        s[l + 3], s[r + 3] = '|', '|'
        s[i + 3], s[j + 3] = 'i', 'j'
        print(''.join(s))
        
        if i < j:
            a[i], a[j] = a[j], a[i]
        else:
            break    
        sleep(1)
        
    a[r] = a[i]
    a[i] = pivot
    return i

In [17]:
sort(quicksort, quicksort_visual, visual = False)
print()
sort(quicksort, quicksort_visual, sentence = "0123456789", visual = False)
print()
sort(quicksort, quicksort_visual, sentence = "9876543210", visual = False)
print()
sort(quicksort, quicksort_visual, sentence = "0193284765", visual = True)

Before sort: "sorting"
After sort : "ginorst"

Before sort: "0123456789"
After sort : "0123456789"

Before sort: "9876543210"
After sort : "0123456789"

Before sort: "0193284765"
quicksort 0 9
    0193284765 
   | i   j  |  
    0143289765 
   |   ji   |  
quicksort 0 4
    0143259768 
   |ji |       
quicksort 0 1
    0123459768 
   ji          
quicksort 0 0
quicksort 2 1
quicksort 3 4
    0123459768 
      ji       
quicksort 3 3
quicksort 5 4
quicksort 6 9
    0123459768 
         i j|  
    0123456798 
         |ji|  
quicksort 6 7
    0123456789 
         ji    
quicksort 6 6
quicksort 8 7
quicksort 9 9
After sort : "0123456789"
