## Реализовать алгоритмы поиска подстрок:

### а) Алгоритм Рабина-Карпа.
### б) Алгоритм на основе конечного автомата.

Для первого алгоритма характерно следующее:

1. Вычисляется хэш подстроки и хэш каждого возможного сдвига подстроки в строке.
2. Если хэши совпадают, проводится дополнительная проверка для исключения ложных срабатываний.

In [1]:
def rabin_karp(text, pattern):
    # Функция для вычисления хэша строки
    def hash_str(s):
        h = 0
        for char in s:
            h = ord(char) + h * 256
        return h
    
    n = len(text)
    m = len(pattern)
    pattern_hash = hash_str(pattern)
    text_hash = hash_str(text[:m])
    
    # Проход по строке и сравнивание хэшей
    for i in range(n - m + 1):
        if text_hash == pattern_hash and text[i:i+m] == pattern:
            return i
        if i < n - m:
            text_hash = ord(text[i+m]) + (text_hash - ord(text[i]) * 256) * 256
    
    return -1

Второй алгоритм работает путём предварительной обработки подстроки и создания автомата для сопоставления символов подстроки с текстом.

In [2]:
def automaton(text, pattern):
    def tr_table(pattern):
        tr = [{char: 0 for char in set(pattern)} for _ in range(len(pattern) + 1)]
        tr[0][pattern[0]] = 1
        prefix = 0
        
        for state in range(1, len(pattern) + 1):
            for char in tr[state].keys():
                if state < len(pattern) and char == pattern[state]:
                    tr[state][char] = state + 1
                else:
                    tr[state][char] = tr[prefix][char]
                    
            prefix = tr[prefix][pattern[state - 1]]
        
        return tr
    
    n = len(text)
    m = len(pattern)
    tr = tr_table(pattern)
    state = 0
    
    for i in range(n):
        state = tr[state].get(text[i], 0)
        if state == m:
            return i - m + 1
    
    return -1

Проверка с использованием unittest

In [3]:
import unittest

class TestAlgorithms(unittest.TestCase):
    
    def test_rabin_karp(self):
        self.assertEqual(rabin_karp("hello", "ll"), 2)
        self.assertEqual(rabin_karp("abcdef", "cde"), 2)
        self.assertEqual(rabin_karp("abcde", "fg"), -1)
    
    def test_automaton(self):
        self.assertEqual(automaton("hello", "ll"), 2)
        self.assertEqual(automaton("abcdef", "cde"), 2)
        self.assertEqual(automaton("abcde", "fg"), -1)

if __name__ == '__main__':
    unittest.main()


E
ERROR: C:\Users\1\AppData\Roaming\jupyter\runtime\kernel-68a914d7-9f65-41cb-a19b-cb07dad5c307 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute 'C:\Users\1\AppData\Roaming\jupyter\runtime\kernel-68a914d7-9f65-41cb-a19b-cb07dad5c307'

----------------------------------------------------------------------
Ran 1 test in 0.004s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
