# üü¶ Knuth-Morris-Pratt (KMP) Algorithmus

## 1Ô∏è‚É£ Grundidee
Der **Knuth-Morris-Pratt (KMP)** Algorithmus sucht ein **Pattern** P in einem **Text** T effizient,
ohne bei einem Mismatch im Text zur√ºckzuspringen.

Kernidee:
- Wenn ein Mismatch passiert, nutzt KMP **Vorwissen √ºber das Pattern**
- Dadurch werden unn√∂tige Vergleiche vermieden
- KMP verwendet dazu ein Hilfsarray: **LPS** (Longest Prefix Suffix)

‚û°Ô∏è Laufzeit: **O(n + m)**
(n = L√§nge Text, m = L√§nge Pattern)

---

## 2Ô∏è‚É£ Voraussetzungen
- Text T und Pattern P sind Strings
- F√§higkeit, ein LPS-Array f√ºr P zu berechnen

---

## 3Ô∏è‚É£ Laufzeiten & Eigenschaften

| Eigenschaft | Wert |
|------------|------|
| Laufzeit | O(n + m) |
| Speicherbedarf | O(m) |
| Backtracking im Text | nein |
| Anwendungsfall | String-Suche |

**Hinweis:**
Der naive Algorithmus kann im Worst Case O(n¬∑m) ben√∂tigen.

---

## 4Ô∏è‚É£ LPS-Array (Longest Prefix Suffix)

### Bedeutung
F√ºr jede Position i im Pattern:
- LPS[i] = L√§nge des **l√§ngsten echten Prefix** von P[0..i],
  der gleichzeitig ein **Suffix** von P[0..i] ist.

‚ÄûEcht‚Äú bedeutet: nicht das ganze Teilwort selbst.

### Beispiel
Pattern:
```
P = "ababaca"
```

LPS:
```
Index:  0 1 2 3 4 5 6
P:      a b a b a c a
LPS:    0 0 1 2 3 0 1
```

---

## 5Ô∏è‚É£ Schritt-f√ºr-Schritt-Idee (Suche)

Wenn bei einem Vergleich Text[i] ‚â† Pattern[j]:
- j wird nicht auf 0 gesetzt (wie beim naiven Ansatz)
- sondern auf **LPS[j-1]**

‚û°Ô∏è So ‚Äûverschiebt‚Äú KMP das Pattern intelligent, ohne Textzeichen erneut zu pr√ºfen.

### Knuth‚ÄìMorris‚ÄìPratt (KMP) ‚Äì Algorithmus in Worten (Grundidee)

Der Knuth‚ÄìMorris‚ÄìPratt-Algorithmus ist ein String-Suchalgorithmus.\
Er sucht ein Muster in einem Text.\
Im Gegensatz zu naiven Suchverfahren vermeidet er unn√∂tige Vergleiche.\
Dazu nutzt er bereits gewonnene Informationen aus vorherigen Vergleichen.\
Das Muster wird dabei nicht im Text zur√ºckgesetzt, sondern intelligent weitergeschoben.\

### KMP ‚Äì Algorithmus in Worten (Suchablauf)

Der Algorithmus richtet das Suchmuster am Anfang des Textes aus.\
Der Vergleich beginnt beim ersten Zeichen des Musters.\
Stimmen die Zeichen √ºberein, wird im Text und im Muster weitergegangen.\
Kommt es zu einer Abweichung, wird das Muster verschoben,\
ohne den Textzeiger zur√ºckzusetzen.\
Die Verschiebung basiert auf einer vorberechneten Tabelle.\
Dieser Vorgang wird wiederholt,\
bis das Muster gefunden wird oder das Ende des Textes erreicht ist.\

### Pr√§fix-Tabelle (LPS) ‚Äì Algorithmus in Worten (sehr pr√ºfungsrelevant)

Vor der eigentlichen Suche wird das Muster analysiert.\
F√ºr jede Position im Muster wird bestimmt,\
wie lang der l√§ngste echte Pr√§fix ist,\
der zugleich ein Suffix des bisher betrachteten Teilmusters ist.\
Diese Werte werden in einer Tabelle gespeichert.\
Bei einem Vergleichsfehler gibt die Tabelle an,\
wie weit das Muster verschoben werden kann,\
ohne bereits best√§tigte √úbereinstimmungen erneut zu pr√ºfen.\

---

## 6Ô∏è‚É£ Besonderheiten / Pr√ºfungsrelevante Hinweise
- KMP ist ein Standardbeispiel f√ºr ‚ÄûPreprocessing‚Äú
- Typische Pr√ºfungsfragen:
  - *Wie wird das LPS-Array berechnet?*
  - *Warum ist die Laufzeit O(n + m)?*
- Wichtig: KMP springt nie im Text zur√ºck, nur im Pattern
- Warum KMP statt Automat?
  - KMP ist oft einfacher zu implementieren
  - Kein expliziter Automat notwendig
  - KMP ist ein spezialisierter, effizient konstruierter Automat f√ºr genau **ein Pattern**

---

## 7Ô∏è‚É£ Vor- und Nachteile

### Vorteile
- garantiert lineare Laufzeit O(n + m)
- sehr effizient bei vielen Wiederholungen im Pattern
- keine erneuten Textvergleiche

### Nachteile
- Konzept LPS ist anf√§nglich schwer
- Preprocessing erforderlich

---

## üß† Merksatz f√ºr die Pr√ºfung
*KMP sucht Pattern in O(n + m), indem es Mismatches mit dem LPS-Array behandelt und nie im Text zur√ºckspringt.*

---

## 8Ô∏è‚É£ Python-Implementierung


In [1]:
def build_lps(pattern):
    lps = [0] * len(pattern)
    length = 0  # L√§nge des aktuellen Prefix-Suffix
    i = 1

    while i < len(pattern):
        if pattern[i] == pattern[length]:
            length += 1
            lps[i] = length
            i += 1
        else:
            if length != 0:
                length = lps[length - 1]
            else:
                lps[i] = 0
                i += 1

    return lps


def kmp_search(text, pattern):
    if not pattern:
        return []

    lps = build_lps(pattern)
    result = []

    i = 0  # Index f√ºr text
    j = 0  # Index f√ºr pattern

    while i < len(text):
        if text[i] == pattern[j]:
            i += 1
            j += 1

        if j == len(pattern):
            result.append(i - j)      # Match gefunden
            j = lps[j - 1]            # weiter suchen
        elif i < len(text) and text[i] != pattern[j]:
            if j != 0:
                j = lps[j - 1]
            else:
                i += 1

    return result


# Beispiel
text = "ababcabcabababd"
pattern = "ababd"
print(kmp_search(text, pattern))  # [10]

[10]
