### Префикс-функция

Дана строка s[0 ... n-1].  
Префикс-функция - массив чисел p[0 ... n-1], где p[i] определяется следующим образом:  
это такая наибольшая длина наибольшего собственного суффикса подстроки s[0 ... i],  
совпадающего с её префиксом (собственный суффикс — значит не совпадающий со всей строкой).  
В частности, значение p[0] полагается равным нулю.  
O(n)

In [4]:
def prefix_func(s):
    n = len(s)

    p = [0] * n

    for i in range(1, n):
        j = p[i-1]
        while j > 0 and s[i] != s[j]:
            j = p[j-1]
        if s[i] == s[j]:
            j+=1
        p[i] = j
    
    return p

#
print(prefix_func('abcdabc'))
print(prefix_func('aabaaab'))
print(prefix_func('ababa'))
print(prefix_func('ababab'))

[0, 0, 0, 0, 1, 2, 3]
[0, 1, 0, 1, 2, 2, 3]
[0, 0, 1, 2, 3]
[0, 0, 1, 2, 3, 4]


### Z-функция

Z-функция от строки s — это массив длины n, i-ый элемент которого равен наибольшему числу символов,  
начиная с позиции i, совпадающих с первыми символами строки s.  
z[i] — это наибольший общий префикс строки s и её i-го суффикса.  
z[0], обычно считают неопределённым.  
O(n)

In [None]:
def z_func(s):
    n = len(s)
    z = [0]*n

    l = r = 0
    for i in range(1, n):
        if i <= r:
            z[i] = min(r-i+1, z[i-l])
        while i+z[i] < n and s[z[i]] == s[i+z[i]]:
            z[i] += 1
        if i+z[i]-1 > r:
            l = i
            r = i+z[i]-1
    return z


#
print(z_func('aaaaa'))
print(z_func('aaabaab'))
print(z_func('abacaba'))

### Алгоритм Кнута-Морриса-Пратта (поиск подстроки в строке)
Time Complexity: O (n+m)  
Space Complexity: O (m)  

In [None]:
def part(pattern):
    ret = [0]
    
    for i in range(1, len(pattern)):
        j = ret[i - 1]
        while j > 0 and pattern[j] != pattern[i]:
            j = ret[j - 1]
        ret.append(j + 1 if pattern[j] == pattern[i] else j)
    return ret


def kmp(orig, pat):
    partial, ret, j = part(pat), [], 0
    
    for i in range(len(orig)):
        while j > 0 and orig[i] != pat[j]:
            j = partial[j - 1]
        if orig[i] == pat[j]: j += 1
        if j == len(pat): 
            ret.append(i - (j - 1))
            j = partial[j - 1]
        
    return ret

# tests
p1 = "aa"
t1 = "aaaaaaaa"

assert(kmp(t1, p1) == [0, 1, 2, 3, 4, 5, 6])

p2 = "abc"
t2 = "abdabeabfabc"

assert(kmp(t2, p2) == [9])

p3 = "aab"
t3 = "aaabaacbaab"

assert(kmp(t3, p3) == [1, 8])

p4 = "11"
t4 = "111"
assert(kmp(t4, p4) == [0, 1])