# Z-функция


In [1]:
from collections.abc import Callable
from colorama import Fore, Style

# Служебная функция для тестирования других функций
def test_function(func: Callable[[str],int],test_values: list[str])->None:
    for i in test_values:
        try:
            result = func(*i[0])
            print (f'Результат функции {func.__name__} на {i[0]} равен {result}')
            assert result == i[1], Fore.RED+ f'Тест с {i[0]} не пройден! {result} != {i[1]}'+Style.RESET_ALL
        except AssertionError as err:
            print(err)
        else:
            print(Fore.GREEN+f'Тест с {i[0]} пройден!'+Style.RESET_ALL)

In [2]:
# функция вычисляет z-функцию строки
# z[i] - длина наибольшей подстроки,
# начинающейся в позиции i и равной префиксу той же длины
# ABABABACABA
# -0503010301
def z_simple(s:str) -> list:
    n = len(s)
    res = [None]*n
    for i in range(1,n):
        j = 0
        while i+j<n and s[i+j]==s[j]:
            j+=1
        res[i] = j
    return res

test_values_z = [
    [['ABABABACABA'],[None,]+[int(i) for i in '0503010301']],
    [['AB'],[None,0]],
    [['ABABABC'],[None,0,4,0,2,0,0]],
    [['SSSSSSS'],[None,6,5,4,3,2,1]]
]

print('Протестируем функцию нахождения z-функции')
test_function(z_simple, test_values_z)

Протестируем функцию нахождения z-функции
Результат функции z_simple на ['ABABABACABA'] равен [None, 0, 5, 0, 3, 0, 1, 0, 3, 0, 1]
[32mТест с ['ABABABACABA'] пройден![0m
Результат функции z_simple на ['AB'] равен [None, 0]
[32mТест с ['AB'] пройден![0m
Результат функции z_simple на ['ABABABC'] равен [None, 0, 4, 0, 2, 0, 0]
[32mТест с ['ABABABC'] пройден![0m
Результат функции z_simple на ['SSSSSSS'] равен [None, 6, 5, 4, 3, 2, 1]
[32mТест с ['SSSSSSS'] пройден![0m


In [3]:
# функция поиска z-блоков
# z-блок - подстрока от i до (i+z[i]-1)
# храним z-block [L..R-1] с наибольшим R, то есть самый правый z-блок
# время работы O(n)
def z_block(s:str) -> list:
    n = len(s)
    L,R = 0,0
    z = [None,]*n
    for i in range(1,n):
        if i >= R:
            j = 0
            while i + j < n and s[i+j]==s[j]:
                j += 1
            L = i
            R = i+j
            z[i] = j
        else:
            if z[i-L]<R-i:
                z[i] = z[i-L]
            else:
                j = R-i
                while i+j<n and s[i+j] == s[j]:
                    j += 1
                L = i
                R = i+j
                z[i] = j
    # z[0] = None
    return z


test_values_z_block = [
    [['abababacaba'],[None,0,5,0,3,0,1,0,3,0,1]],
    [['abc'],[None,0,0]],
    [['ababac'],[None,0,3,0,1,0]]
]

print('Протестируем функцию нахождения z-блоков')
test_function(z_block, test_values_z_block)

Протестируем функцию нахождения z-блоков
Результат функции z_block на ['abababacaba'] равен [None, 0, 5, 0, 3, 0, 1, 0, 3, 0, 1]
[32mТест с ['abababacaba'] пройден![0m
Результат функции z_block на ['abc'] равен [None, 0, 0]
[32mТест с ['abc'] пройден![0m
Результат функции z_block на ['ababac'] равен [None, 0, 3, 0, 1, 0]
[32mТест с ['ababac'] пройден![0m


In [4]:
# функция поиска с помощью z-функции
def find(s:str,subs:str) -> int:
    z = z_block(subs+'#'+s)
    m = len(subs)
    for (i,val) in enumerate(z[m+1:]):
        if val == m:
            return i
    return -1

test_values = [
    [['ababa','ab'],0],
    [['treasure','sure'],4],
    [['s','s'],0],
    [['qwerty','u'],-1],
    [['qwerqwerty','qwerty'],4]
]

print('Протестируем функцию поиска подстроки')
test_function(find, test_values)

Протестируем функцию поиска подстроки
Результат функции find на ['ababa', 'ab'] равен 0
[32mТест с ['ababa', 'ab'] пройден![0m
Результат функции find на ['treasure', 'sure'] равен 4
[32mТест с ['treasure', 'sure'] пройден![0m
Результат функции find на ['s', 's'] равен 0
[32mТест с ['s', 's'] пройден![0m
Результат функции find на ['qwerty', 'u'] равен -1
[32mТест с ['qwerty', 'u'] пройден![0m
Результат функции find на ['qwerqwerty', 'qwerty'] равен 4
[32mТест с ['qwerqwerty', 'qwerty'] пройден![0m
