# Алгоритм Кнута-Морриса-Пратта

Общая идея
- Сдвиг образца по тексту – более чем на одну позицию
- Используется массив граней

Схема алгоритма:
- Пусть при «прикладывании» образца P к тексту T совпали k символов (весь образец или его часть)
- Продвижение на 1 позицию (как в наивном алгоритме)
- Продвижение на несколько позиций
- Рекомендуемое перемещение: k - bp[k-1]
- После продвижения сравнению с текстом подлежат лишь символы образца справа от префикса длины bp[k-1]
- При меньших гранях продвижение быстрее, но
- Чем больше грань, тем меньше потребуется сравнений
- Предыдущее сравнение было неуспешным из-за несовпадения P[k] с некоторым символом текста T[i] (либо k – длина образца)
- После перемещения с тем же T[i] сравнивается символ P[bp[k-1]]
- По тексту – поступательное движение (i не убывает)

In [1]:
from kmp import *

## Оценка сложности
- Построение массивов граней – ϴ(m)
- Цикл for повторяется n раз, что при отсутствии внутреннего цикла составило бы ϴ(n)
- Вложенный while обещает квадратичную сложность, однако целесообразно оценить его общее количество выполнений
- Переменная k принимает неотрицательные значения и начинает с нуля. Увеличивается на ≤ 1 на каждом шаге for
- Каждый шаг while уменьшает k на ≥1
- Общее число уменьшений (шагов цикла while за все время) ≤ общего числа увеличений (n), что дает O(n)
- Cуммарная сложность алгоритма равна ϴ(m+n)

### Что нужно сказать
За счет чего происходит быстрый поиск? - За счет того что алгоритм позволяет обеспечить быстрое перемещение по образцу. По тексту мы всегда идем линейно.

In [3]:
positions = kmp('dadata', 'dadadata')
print(positions)

[2]
