# Suchalgorithmen

## Sequenzielle Suche

Bei der sequenziellen Suche wird die Liste sequenziell durchlaufen, bis der gesuchte Wert gefunden wurde oder das Ende der Liste erreicht ist. 

Die im folgenden vorgestellte Python-Implementation liefert den Index des gefundenen Wertes zurück. Wurde der Wert nicht gefunden, so liefert sie -1 zurück.

In [32]:
def sequential_search(liste, k):
    for i in range(len(liste)):
        if liste[i] == k:
            return i
    
    return -1

In [34]:
testliste = [4, 11, 2, 19, 3, 4]

sequential_search(testliste, 19)

3

In [35]:
sequential_search(testliste, 27)

-1

## Binäre Suche
Bei der binären Suche wird nach dem Divide-And-Conquer-Prinzip ähnlich wie bei Quick Sort die Liste geteilt und mit Rekursion gearbeitet.

Dabei wird das Element in der Mitte untersucht, ob es mit dem gesuchten Wert übereinstimmt. Wenn ja, wird der Index zurückgeliefert. Wenn nicht, wird die Liste geteilt in die Elemente vor und die Elemente nach dem mittleren Element. Auf diese Teillisten wird dann wieder eine binäre Suche ausgeführt.

Ist die Länge der betrachteten Liste 0, so wird -1 (nicht gefunden) zurückgegeben.

In [113]:
def binary_search(liste, k, start=0, end=None):
    if end is None:
        end = len(liste) - 1
        
    if end - start < 0:
        return -1
    
    mitte = (start + end) // 2
    if liste[mitte] == k:
        return mitte
    
    if liste[mitte] > k:
        result = binary_search(liste, k, start=start, end=mitte-1)
    elif liste[mitte] < k:
        result = binary_search(liste, k, start=mitte+1, end=end)
    
    return result

In [114]:
testliste = [1, 3, 17, 22, 29, 53]

binary_search(testliste, 53)

5

In [116]:
testliste = [1, 2, 3, 5, 11, 99]
binary_search(testliste, 17)

-1

## Fibonacci-Suche

In [72]:
def fib_search(liste, k):
    raise NotImplemented("Muss noch erledigt werden.")

# Naives String-Matching

In [68]:
def naive_match(string, match):
    for i in range(len(string) - len(match) + 1):
        gefunden = True
        for j in range(len(match)):
            if string[i+j] != match[j]:
                gefunden = False
                break
        
        if gefunden:
            return i
        
    return -1
    

In [69]:
teststring = "Hallo IUBH. Ihr seid die besten - und die teuersten!"
match = "IUBH"

naive_match(teststring, match)

6

Perfekt! Die Zeichenkette "IUBH" wurde an Position 6 (immer ausgehend von 0) gefunden.
Da wir zu faul sind, nachzuzählen, lassen wir Python den Teststring ab Position 6 für uns ausgeben:

In [73]:
teststring[6:]

'IUBH. Ihr seid die besten - und die teuersten!'

Das Wort "Studentin" kommt in unserem Teststring nicht vor - wir müssten also -1 als Index zurückgeliefert bekommen:

In [70]:
match = "Studentin"

naive_match(teststring, match)

-1

## Knuth-Morris-Pratt-Verfahren

In [88]:
def prefix(match):
    """Erstellt die Präfixtabelle für das Muster match"""
    
    len_prefix = -1
    prefix = [len_prefix] 
    
    for pos in range(len(match)):
        while len_prefix >= 0 and match[pos] != match[len_prefix]:
            len_prefix = prefix[len_prefix]
        
        len_prefix += 1
        prefix.append(len_prefix)
    
    return prefix


In [109]:
match = "ababccdcdababa"
t = prefix(match)

result = []
for index, i in enumerate(t[1:]):
    result.append(
        list(match[:i]) + [" "]*(index - 2*i + 1) + list(match[:i]) + [" "] * (len(match)-(index+1)) + [i]
    )
    
result

[[' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 ['a', ' ', 'a', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 1],
 ['a', 'b', 'a', 'b', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 2],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 0],
 ['a', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 'a', ' ', ' ', ' ', ' ', 1],
 ['a', 'b', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 'a', 'b', ' ', ' ', ' ', 2],
 ['a', 'b', 'a', ' ', ' ', ' ', ' ', ' ', ' ', 'a', 'b', 'a', ' ', ' ', 3],
 ['a', 'b', 'a', 'b', ' ', ' ', ' ', ' ', ' ', 'a', 'b', 'a', 'b', ' ', 4],
 ['a', 'b', 