## Реализовать алгоритмы поиска подстрок:

### a) Алгоритм Бойера-Мура.
### b) Алгоритм Кнута-Морриса-Пратта.

Алгоритм Бойера-Мура использует предварительно вычисленную таблицу смещений для быстрого сравнения подстроки с текстом. Он сначала ищет символ в тексте, который не принадлежит подстроке, и затем использует таблицу смещений для перехода к следующему возможному вхождению. 

In [1]:
#  Функция heuristic(pattern) создает таблицу bad_char, в которой каждому символу из строки pattern 
# сопоставляется его последнее вхождение в эту строку (индекс символа)
# это необходимо для эффективного перемещения шаблона относительно текста.

#  В функции boyer_moore(text, pattern):
#    - m и n - длины шаблона и текста соответственно.
#    - Создается таблица bad_char с помощью вызова heuristic(pattern).
#    - Переменная shift используется для отслеживания позиции в тексте, с которой начинается проверка.
#    - Затем выполняется поиск шаблона в тексте: сравниваются символы с конца шаблона и текста, сдвигаясь влево. 
#      Если обнаружено несовпадение, вычисляется смещение с помощью таблицы bad_char и максимального значения между 1 
#      и разности текущего индекса и индекса символа в таблице bad_char.
#    - Если шаблон найден, возвращается позиция в тексте, с которой он начинается. В противном случае возвращается -1.

def heuristic(pattern):
    bad_char = {}
    for i in range(len(pattern)):
        bad_char[pattern[i]] = i
    return bad_char

def boyer_moore(text, pattern):
    m = len(pattern)
    n = len(text)
    bad_char = heuristic(pattern)
    
    shift = 0
    while shift <= n - m:
        j = m - 1
        while j >= 0 and pattern[j] == text[shift + j]:
            j -= 1
        if j < 0:
            return shift
        else:
            shift += max(1, j - bad_char.get(text[shift + j], -1))
    
    return -1

Алгоритм Кнута-Морриса-Пратта основан на принципе "отката", когда при несоответствии символов в подстроке и тексте мы используем уже известную информацию о вхождениях подстроки в самой себе.

In [2]:
# Функция prefix_function(pattern) вычисляет префикс-функцию для строки pattern. 
# Префикс-функция позволяет определить наибольший префикс строки, который одновременно является её суффиксом. 
# Это используется для эффективного перемещения в строке при сравнении с текстом.

#  Функция kmp_search(text, pattern) выполняет поиск подстроки pattern в тексте text. 
#    - Вычисляются длины текста n и шаблона m.
#    - Вызывается prefix_function(pattern) для получения префикс-функции.
#    - Переменная q используется для отслеживания длины совпавшего префикса в шаблоне.
#    - Производится сравнение символов шаблона и текста:
#      - Если символы не совпадают, используется префикс-функция для вычисления следующей позиции q, 
#        на которой можно продолжить сравнение.
#      - Если символы совпадают, увеличиваем q.
#    - Если q равно длине шаблона m, это означает, что шаблон найден в тексте, и возвращается позиция начала вхождения.
#    - Если не найдено, возвращается -1.

def prefix_function(pattern):
    m = len(pattern)
    pi = [0] * m
    k = 0
    for q in range(1, m):
        while k > 0 and pattern[k] != pattern[q]:
            k = pi[k - 1]
        if pattern[k] == pattern[q]:
            k += 1
        pi[q] = k
    return pi

def kmp_search(text, pattern):
    n = len(text)
    m = len(pattern)
    pi = prefix_function(pattern)
    
    q = 0
    for i in range(n):
        while q > 0 and pattern[q] != text[i]:
            q = pi[q - 1]
        if pattern[q] == text[i]:
            q += 1
        if q == m:
            return i - m + 1
    return -1

Далее проверка unittest

In [3]:
import unittest

class TestAlgorithms(unittest.TestCase):
    
    def test_boyer_moore(self):
        text = "ABAAABCD"
        pattern = "ABC"
        self.assertEqual(boyer_moore(text, pattern), 4)
    
    def test_kmp_search(self):
        text = "ABABDABACDABABCABAB"
        pattern = "ABABCABAB"
        self.assertEqual(kmp_search(text, pattern), 14)

if __name__ == '__main__':
    unittest.main()

E
ERROR: C:\Users\1\AppData\Roaming\jupyter\runtime\kernel-9502818e-f4a3-435b-8fd1-0dbf262be605 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute 'C:\Users\1\AppData\Roaming\jupyter\runtime\kernel-9502818e-f4a3-435b-8fd1-0dbf262be605'

----------------------------------------------------------------------
Ran 1 test in 0.004s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
