In [1]:
def bad_character_table(pattern):
    """
    Создает таблицу плохих символов для алгоритма Бойера-Мура.
    """
    table = {}
    length = len(pattern)
    for i in range(length):
        table[pattern[i]] = i
    return table

In [2]:
def good_suffix_table(pattern):
    """
    Создает таблицу хороших суффиксов для алгоритма Бойера-Мура.
    """
    length = len(pattern)
    table = [0] * (length + 1)
    border = [0] * (length + 1)

    # Сначала вычисляем значения для таблицы border
    i = length
    j = length + 1
    border[i] = j

    while i > 0:
        while j <= length and pattern[i - 1] != pattern[j - 1]:
            if table[j] == 0:
                table[j] = j - i
            j = border[j]
        i -= 1
        j -= 1
        border[i] = j

    # Заполняем оставшиеся значения таблицы table
    j = border[0]
    for i in range(length + 1):
        if table[i] == 0:
            table[i] = j
        if i == j:
            j = border[j]

    return table

In [3]:
def boyer_moore(text, pattern):
    """
    Алгоритм Бойера-Мура для поиска подстроки в строке.
    """
    bad_char = bad_character_table(pattern)
    good_suffix = good_suffix_table(pattern)
    m = len(pattern)
    n = len(text)

    occurrences = []
    s = 0  # s - смещение шаблона относительно текста

    while s <= n - m:
        j = m - 1

        while j >= 0 and pattern[j] == text[s + j]:
            j -= 1

        if j < 0:
            occurrences.append(s)
            s += good_suffix[0]
        else:
            bad_char_shift = bad_char.get(text[s + j], -1)
            s += max(good_suffix[j + 1], j - bad_char_shift)

    return occurrences

In [4]:
# Пример использования алгоритма Бойера-Мура
if __name__ == "__main__":
    text = "ABABDABACDABABCABAB"
    pattern = "ABABCABAB"

    result = boyer_moore(text, pattern)
    print("Паттерн найден в позициях:", result)

Паттерн найден в позициях: [10]
