# Алгоритм Кнута-Морриса-Пратца
Время работы: $O(n+m)$, где n - длина строки, m - длина подстроки

In [11]:
from collections.abc import Callable

# Служебная функция для тестирования других функций
def test_function(func: Callable[[str],int],test_values: list[str])->None:
    for i in test_values:
        try:
            result = func(*i[0])
            print (f'Результат функции {func.__name__} на {i[0]} равен {result}')
            assert result == i[1], f'Тест с {i[0]} не пройден! {result} != {i[1]}'
        except AssertionError as err:
            print(err)
        else:
            print(f'Тест с {i[0]} пройден!')

In [12]:
# функция построения префиксов для строки
# префикс - максимальный по длине собственный префикс строки s, являющийся также ее суффиксом
# функция строит массив префиксов, где каждому символу соответствует
# длина префикса подстроки, заканчивающейся этим префиксом
def pref(s:str) -> list:
    n = len(s)
    res = [0 for i in range(0, n+1)]
    # i идет по строке, начиная со второго символа.
    # у подстроки из двух символов префикс равен пустой строке
    i = 1
    # j идет по виртуальной копии строки, которую мы прикладываем к имеющейся строке
    j = 0
    while i < n:
        # если символы совпали, все хорошо, для данной подстроки префикс существует
        # и он длиной j+1(нумерация идет с нуля)
        if s[i] == s[j]:
            res[i+1] = j+1
            i+=1
            j+=1
        else:
            # если префикс уже не пустой, то перемещаемся на длину префикса
            if j>0:
                j = res[j]
            else:
                # если префикс пустой, а символы не совпали, то просто запишем ноль в результат
                res[i+1] = 0
                i += 1
    # нулевой префикс - для пустой подстроки
    res[0] = None
    return res

test_values = [
    [['abacababacb'],[None,0,0,1,0,1,2,3,2,3,4,0]],
    [['ababab'],[None,0,0,1,2,3,4]],
    [['AB'],[None,0,0]],
    [['abcda'],[None,0,0,0,0,1]],
    [['abababa'],[None,0,0,1,2,3,4,5]]
]

print('Протестируем функцию построения префиксов:')
test_function(pref, test_values)

Протестируем функцию построения префиксов:
Результат функции pref на ['abacababacb'] равен [None, 0, 0, 1, 0, 1, 2, 3, 2, 3, 4, 0]
Тест с ['abacababacb'] пройден!
Результат функции pref на ['ababab'] равен [None, 0, 0, 1, 2, 3, 4]
Тест с ['ababab'] пройден!
Результат функции pref на ['AB'] равен [None, 0, 0]
Тест с ['AB'] пройден!
Результат функции pref на ['abcda'] равен [None, 0, 0, 0, 0, 1]
Тест с ['abcda'] пройден!
Результат функции pref на ['abababa'] равен [None, 0, 0, 1, 2, 3, 4, 5]
Тест с ['abababa'] пройден!


In [13]:
# функция поиска подстроки с помощью массива префиксов
def kmp(s:str,sub:str)->int:
    i,j=0,0
    n = len(s)
    m = len(sub)
    p = pref(s)
    while i<n and j<m:
        if s[i]==sub[j]:
            i+= 1
            j+= 1
        else:
            if j>0:
                j = p[j]
            else:
                i += 1
    if j == m:
        return i-m
    else:
        return -1

test_values = [
    [['ababa','ab'],0],
    [['treasure','sure'],4],
    [['s','s'],0],
    [['qwerty','u'],-1],
    [['qwerqwerty','qwerty'],4]
]

print('Протестируем функцию поиска подстрок:')
test_function(kmp, test_values)

Протестируем функцию поиска подстрок:
Результат функции kmp на ['ababa', 'ab'] равен 0
Тест с ['ababa', 'ab'] пройден!
Результат функции kmp на ['treasure', 'sure'] равен 4
Тест с ['treasure', 'sure'] пройден!
Результат функции kmp на ['s', 's'] равен 0
Тест с ['s', 's'] пройден!
Результат функции kmp на ['qwerty', 'u'] равен -1
Тест с ['qwerty', 'u'] пройден!
Результат функции kmp на ['qwerqwerty', 'qwerty'] равен 4
Тест с ['qwerqwerty', 'qwerty'] пройден!
