# Sortieralgorithmen

Beachte, dass die im weiteren Verlauf dargestellten Sortieralgorithmen mit Ausnahme von Quick Sort die Liste "in place" sortieren. Das bedeutet, dass die an die entsprechende Prozedur übergebene Liste im Original verändert und zurückgegeben wird.

## Selection Sort

Selection Sort folgt dem Prinzip des "Sortieren durch Auswählen".

Dabei teilen wir die zu sortierende Liste in einen sortierten Teil, der am Anfang noch leer ist und einen noch zu sortierenden Teil, der zu Beginn alle Listenelemente enthält. Beim aufsteigenden Sortieren wird nun in jedem Schritt das kleinste Element der unsortierten Liste ausgewählt und an die sortierte Liste angehängt.

In [66]:
def selection_sort(liste):
    for i in range(len(liste)):
        # Minimum mit dem aktuellen Index initialisieren
        mini = i
        
        # Index des Minimums finden
        for j in range(i, len(liste)):
            if liste[j] < liste[mini]:
                mini = j
        
        # Tauschen des Elementes an der aktuellen Position i mit dem Minimum
        t = liste[i]
        liste[i] = liste[mini]
        liste[mini] = t
        
    return liste

In [67]:
testliste = [17, 6, 19, 6, 2, 1, 12, 0]

selection_sort(testliste)

[0, 1, 2, 6, 6, 12, 17, 19]

## Insertion Sort
Insert Sort folgt dem Prinzip des "Sortieren durch Einfügen".

Dabei wird die Liste wie im Abschnitt "Selection Sort" beschrieben wieder geteilt in einen sortierten und einen unsortierten Teil und zu Anfang entsprechend initialisiert.
Im Unterschied zum Selection Sort wird aber nun nicht das Minimum der unsortierten Teilliste gesucht, sondern es wird das jeweils erste Element der Liste gewählt und an passender Stelle in den sortierten Teil eingefügt. Bevor dies geschehen kann, müssen alle Elemente, die größer sind als das einzusortierende Element, eine Position nach rechts verschoben werden, so dass eine "Lücke" für das einzusortierende Element entsteht.

In [3]:
def insertion_sort(liste):
    for i in range(1, len(liste)):
        insert_pos = 0
        
        # Einfügeposition finden
        for j in range(i):
            if liste[j] > liste[i]:
                insert_pos = j
                break
        
        # Einzufügenden Wert merken
        wert = liste[i]
        
        # Nach rechts schieben
        for j in range(i, insert_pos, -1):
            liste[j] = liste[j-1]
            
        # Element einfügen
        liste[insert_pos] = wert
        
    return liste            

In [4]:
testliste = [24, 1, 7, 13, 8, 11, 0, 8]

insertion_sort(testliste)

[0, 1, 7, 8, 8, 11, 13, 24]

## Bubble Sort

Beim Bubble-Sort-Algorithmus wird die zu sortierende Liste solange immer wieder durchlaufen und dabei Nachbarelemente ggf. getauscht, bis kene Vertauschungen mehr möglich sind.

Bläst man mit einem Strohhalm Luft in ein mit Wasser gefülltes Glas, so steigen Luftblasen (engl. *Bubbles*) an die Oberfläche. Ähnliches passiert bei diesem Sortieralgorithmus: Große Schlüsselwerte wandern in jedem Durchlauf weiter nach rechts, bis sie ihre endgültige Position erreicht haben.


In [7]:
def bubble_sort(liste):
    for i in range(len(liste) - 1):
        getauscht = False
        
        for j in range(len(liste) - 1):
            if liste[j] > liste[j + 1]:
                t = liste[j]
                liste[j] = liste[j + 1]
                liste[j+1] = t
                getauscht = True
        
        # Es wurde nichts mehr getauscht => Abbruch
        if not getauscht:
            break
            
    return liste
            

In [6]:
testliste = [88, 1, 5, 4, 32, 5, 12, 3]

bubble_sort(testliste)

[1, 3, 4, 5, 5, 12, 32, 88]

## Quick Sort
Quick Sort ist einer der schnellsten Sortieralgorithmen verfolgt ein rekursives Prinzip und arbeitet nach dem Divide-And-Conquer-Prinzip.

Dabei wird das mittlere Element der unsortierten Liste ausgewählt und die Liste in zwei Teile geteilt: Der erste Teil enthält alle Elemente, die kleiner oder gleich dem mittleren Element sind, der zweite Teil enthält alle übrigen Elemente. Das mittlere Element selbst ist jedoch in keiner der beiden Teillisten enthalten.

Auf die so entstandenen Teile wird nun wieder der Quick-Sort-Algorithmus angewendet. Die so sortierten Teile und das mittlere Element werden wieder zu einer Liste zusammengefügt und zurückgegeben.

Erhält die Quick-Sort-Funktion eine Liste der Länge 1, so liefert er sie einfach unverändert zurück - hier ist also das Ende der Rekursion erreicht und das Verfahren terminiert.

In [30]:
def quick_sort(liste):
    if len(liste) <= 1:
        return liste    
    else:
        mitte = len(liste) // 2
    
        links = []
        rechts = []
        
        for i in range(len(liste)):
            if i != mitte:
                if liste[i] <= liste[mitte]:
                    links.append(liste[i])
                else:
                    rechts.append(liste[i])
                           
        return quick_sort(links) + [liste[mitte]] + quick_sort(rechts)
    
    return 

In [31]:
testliste = [12, 1, 77, 12, 3, 8, 6]

quick_sort(testliste)

[1, 3, 6, 8, 12, 12, 77]

# Suchalgorithmen

## Sequenzielle Suche

Bei der sequenziellen Suche wird die Liste sequenziell durchlaufen, bis der gesuchte Wert gefunden wurde oder das Ende der Liste erreicht ist. 

Die im folgenden vorgestellte Python-Implementation liefert den Index des gefundenen Wertes zurück. Wurde der Wert nicht gefunden, so liefert sie -1 zurück.

In [32]:
def sequential_search(liste, k):
    for i in range(len(liste)):
        if liste[i] == k:
            return i
    
    return -1

In [34]:
testliste = [4, 11, 2, 19, 3, 4]

sequential_search(testliste, 19)

3

In [35]:
sequential_search(testliste, 27)

-1

## Binäre Suche
Bei der binären Suche wird nach dem Divide-And-Conquer-Prinzip ähnlich wie bei Quick Sort die Liste geteilt und mit Rekursion gearbeitet.

Dabei wird das Element in der Mitte untersucht, ob es mit dem gesuchten Wert übereinstimmt. Wenn ja, wird der Index zurückgeliefert. Wenn nicht, wird die Liste geteilt in die Elemente vor und die Elemente nach dem mittleren Element. Auf diese Teillisten wird dann wieder eine binäre Suche ausgeführt.

Ist die Länge der betrachteten Liste 0, so wird -1 (nicht gefunden) zurückgegeben.

In [113]:
def binary_search(liste, k, start=0, end=None):
    if end is None:
        end = len(liste) - 1
        
    if end - start < 0:
        return -1
    
    mitte = (start + end) // 2
    if liste[mitte] == k:
        return mitte
    
    if liste[mitte] > k:
        result = binary_search(liste, k, start=start, end=mitte-1)
    elif liste[mitte] < k:
        result = binary_search(liste, k, start=mitte+1, end=end)
    
    return result

In [114]:
testliste = [1, 3, 17, 22, 29, 53]

binary_search(testliste, 53)

5

In [116]:
testliste = [1, 2, 3, 5, 11, 99]
binary_search(testliste, 17)

-1

## Fibonacci-Suche

In [72]:
def fib_search(liste, k):
    raise NotImplemented("Muss noch erledigt werden.")

# Naives String-Matching

In [68]:
def naive_match(string, match):
    for i in range(len(string) - len(match) + 1):
        gefunden = True
        for j in range(len(match)):
            if string[i+j] != match[j]:
                gefunden = False
                break
        
        if gefunden:
            return i
        
    return -1
    

In [69]:
teststring = "Hallo IUBH. Ihr seid die besten - und die teuersten!"
match = "IUBH"

naive_match(teststring, match)

6

Perfekt! Die Zeichenkette "IUBH" wurde an Position 6 (immer ausgehend von 0) gefunden.
Da wir zu faul sind, nachzuzählen, lassen wir Python den Teststring ab Position 6 für uns ausgeben:

In [73]:
teststring[6:]

'IUBH. Ihr seid die besten - und die teuersten!'

Das Wort "Studentin" kommt in unserem Teststring nicht vor - wir müssten also -1 als Index zurückgeliefert bekommen:

In [70]:
match = "Studentin"

naive_match(teststring, match)

-1

## Knuth-Morris-Pratt-Verfahren

In [88]:
def prefix(match):
    """Erstellt die Präfixtabelle für das Muster match"""
    
    len_prefix = -1
    prefix = [len_prefix] 
    
    for pos in range(len(match)):
        while len_prefix >= 0 and match[pos] != match[len_prefix]:
            len_prefix = prefix[len_prefix]
        
        len_prefix += 1
        prefix.append(len_prefix)
    
    return prefix


In [109]:
match = "ababccdcdababa"
t = prefix(match)

result = []
for index, i in enumerate(t[1:]):
    result.append(
        list(match[:i]) + [" "]*(index - 2*i + 1) + list(match[:i]) + [" "] * (len(match)-(index+1)) + [i]
    )
    
result

[[' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 ['a', ' ', 'a', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 1],
 ['a', 'b', 'a', 'b', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 2],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 ['a', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 'a', ' ', ' ', ' ', ' ', 1],
 ['a', 'b', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 'a', 'b', ' ', ' ', ' ', 2],
 ['a', 'b', 'a', ' ', ' ', ' ', ' ', ' ', ' ', 'a', 'b', 'a', ' ', ' ', 3],
 ['a', 'b', 'a', 'b', ' ', ' ', ' ', ' ', ' ', 'a', 'b', 'a', 'b', ' ', 4],
 ['a', 'b', 