# üü¶ Boyer‚ÄìMoore Algorithmus

## 1Ô∏è‚É£ Grundidee
Der **Boyer‚ÄìMoore** Algorithmus sucht ein **Pattern** P in einem **Text** T, indem er Vergleiche
**von rechts nach links** im Pattern macht und bei einem Mismatch das Pattern **weit nach rechts verschiebt**.

Kernideen (Heuristiken):
- **Bad Character Rule** (schlechtes Zeichen)
- **Good Suffix Rule** (gutes Suffix)

‚û°Ô∏è In der Praxis oft sehr schnell, besonders bei gro√üen Alphabeten und langen Patterns.

---

## 2Ô∏è‚É£ Voraussetzungen
- Text T und Pattern P sind Strings
- Vorverarbeitung des Patterns (Tabellen f√ºr Verschiebungen)

---

## 3Ô∏è‚É£ Laufzeiten & Eigenschaften

| Eigenschaft | Wert |
|------------|------|
| Best / typische Praxis | sehr schnell (sublinear m√∂glich) |
| Worst Case | O(n¬∑m) (ohne Good-Suffix) |
| Speicherbedarf | O(|Œ£| + m) |
| Backtracking im Text | nein |
| Anwendungsfall | String-Suche |

**Hinweis:**
Mit beiden Heuristiken ist die Worst-Case-Garantie besser, aber die Implementierung wird deutlich komplexer.
In Pr√ºfungen wird oft die **Bad Character Rule** fokussiert.

---

## 4Ô∏è‚É£ Bad Character Rule (Pr√ºfungsfokus)

### Idee
Wenn ein Mismatch passiert (Textzeichen passt nicht zum Patternzeichen),
kann das Pattern so verschoben werden, dass:
- das mismatching Zeichen im Pattern **unter seiner letzten Vorkommen-Position** liegt
- oder, falls es nicht vorkommt, das Pattern komplett dar√ºber hinweg springt

Dazu wird eine Tabelle `last[char]` berechnet:
- `last[c]` = letzter Index von Zeichen c im Pattern (oder -1)

---

## 5Ô∏è‚É£ Schritt-f√ºr-Schritt-Beispiel (Bad Character)

Text:
```
HERE IS A SIMPLE EXAMPLE
```
Pattern:
```
EXAMPLE
```

Vergleich startet am Pattern-Ende (rechts).
Bei Mismatch wird anhand von `last[text_char]` die Verschiebung bestimmt.

---

## 6Ô∏è‚É£ Good Suffix Rule (kurz, der Vollst√§ndigkeit halber)
Wenn ein Suffix im Pattern bereits gematcht hat und dann ein Mismatch kommt,
verschiebt man das Pattern so, dass:
- das gematchte Suffix erneut passend ausgerichtet wird
- oder ein passender Prefix genutzt wird

‚û°Ô∏è Diese Regel macht Boyer‚ÄìMoore noch schneller, ist aber komplexer.

---

## 7Ô∏è‚É£ Besonderheiten / Pr√ºfungsrelevante Hinweise
- Boyer‚ÄìMoore vergleicht **von rechts nach links**
- Typische Pr√ºfungsfrage:
  - *Wie wird die Verschiebung bei Bad Character berechnet?*
- H√§ufig reicht eine Implementierung der Bad-Character-Heuristik

---

## 8Ô∏è‚É£ Vor- und Nachteile

### Vorteile
- in der Praxis extrem schnell
- wenige Vergleiche (sublinear m√∂glich)
- gut bei gro√üem Alphabet (ASCII/Unicode)

### Nachteile
- komplexer als KMP
- Worst Case kann ohne Good-Suffix schlecht sein

---

## üß† Merksatz f√ºr die Pr√ºfung
*Boyer‚ÄìMoore sucht von rechts nach links und verschiebt das Pattern mit Bad-Character- und Good-Suffix-Regeln weit nach rechts.*

---

## 9Ô∏è‚É£ Python-Implementierung (Bad Character Heuristik)


In [1]:
def build_last(pattern):
    last = {}
    for i, ch in enumerate(pattern):
        last[ch] = i
    return last


def boyer_moore_search(text, pattern):
    if not pattern:
        return []

    last = build_last(pattern)
    n, m = len(text), len(pattern)
    result = []

    i = 0  # Startindex im Text f√ºr das aktuelle Pattern-Fenster
    while i <= n - m:
        j = m - 1  # Vergleich startet rechts im Pattern

        while j >= 0 and pattern[j] == text[i + j]:
            j -= 1

        if j < 0:
            result.append(i)
            # Verschiebe um 1 oder um m (hier: 1, um weitere Matches zu finden)
            i += 1
        else:
            bad_char = text[i + j]
            shift = j - last.get(bad_char, -1)
            i += max(1, shift)

    return result


# Beispiel
text = "HERE IS A SIMPLE EXAMPLE"
pattern = "EXAMPLE"
print(boyer_moore_search(text, pattern))  # [17]

[17]
