# Z-блоки

Определение. Значение $Z_i(S)$ – длина наибольшей подстроки в S,
которая начинается в позиции $i > 0$ и совпадает с префиксом S.
- Такая подстрока называется Z-блоком
- При $i = 0$ полагают $Z_0(S) = 0$


1. **$i \ge right$**:
Просто пробегаемся по строке S и сравниваем символы на позициях S[i+j] и S[j]. Пусть j первая позиция в строке S для которой не выполняется равенство S[i+j]=S[j], тогда j это и Z-функция для позиции i. Тогда left=i, right=i+j−1. В данном случае будет определено корректное значение Z[i] в силу того, что оно определяется наивно, путем сравнения с начальными символами строки.
2. **$i < right$**:
Сравним Z[i−left]+i и right. Если right меньше, то надо просто наивно пробежаться по строке начиная с позиции right и вычислить значение Z[i]. Корректность в таком случае также гарантирована. Иначе мы уже знаем верное значение Z[i], так как оно равно значению Z[i−left].

In [15]:
from blocks import *

zbp = prefix_z_values("AABCAABXAAZ")
print(zbp)

1: i:1 z[1]=1 l=1 r=2  A
1: i:2 z[2]=0 l=2 r=2  
1: i:3 z[3]=0 l=3 r=3  
1: i:4 z[4]=3 l=4 r=7  AAB
2: i:5 z[5]=1 l=4 r=7  A
2: i:6 z[6]=0 l=4 r=7  
1: i:7 z[7]=0 l=7 r=7  
1: i:8 z[8]=2 l=8 r=10  AA
3: i:9 z[9]=1 l=9 r=10  A
1: i:10 z[10]=0 l=10 r=10  
[0, 1, 0, 0, 3, 1, 0, 0, 2, 1, 0]


## Сложность

Цикл for повторяется n-1 раз, что при отсутствии вложенных
циклов составило бы ϴ(n).
- StrComp() содержит цикл while, что угрожает квадратичной
сложностью, однако оценим его общее число выполнений.
- Оно соответствует числу всех сравнений символов, взятых,
например, из правых сравниваемых подстрок.
- Первое же «неудачное» сравнение прерывает цикл while,
поэтому число всех таких сравнений оценивается как O(n).
- Каждое «положительное» сравнение увеличивает неубывающее
r. Поскольку всегда 0 ≤ r ≤ n, то число таких увеличений не может
превысить n.
- Таким образом, общее число повторений тела цикла while
оценивается через O(n), и рассматриваемый алгоритм имеет
сложность ϴ(n).

In [14]:
from blocks import *

zbp = prefix_z_values("AABCAABXAAZ")
print(zbp)

1: i:1 z[1]=1 l=1 r=2  A
1: i:2 z[2]=0 l=2 r=2  
1: i:3 z[3]=0 l=3 r=3  
1: i:4 z[4]=3 l=4 r=7  AAB
2: i:5 z[5]=1 l=4 r=7  A
2: i:6 z[6]=0 l=4 r=7  
1: i:7 z[7]=0 l=7 r=7  
1: i:8 z[8]=2 l=8 r=10  AA
3: i:9 z[9]=1 l=9 r=10  A
1: i:10 z[10]=0 l=10 r=10  
[0, 1, 0, 0, 3, 1, 0, 0, 2, 1, 0]


## Сложность

Цикл for повторяется n-1 раз, что при отсутствии вложенных
циклов составило бы ϴ(n).
- StrComp() содержит цикл while, что угрожает квадратичной
сложностью, однако оценим его общее число выполнений.
- Оно соответствует числу всех сравнений символов, взятых,
например, из правых сравниваемых подстрок.
- Первое же «неудачное» сравнение прерывает цикл while,
поэтому число всех таких сравнений оценивается как O(n).
- Каждое «положительное» сравнение увеличивает неубывающее
r. Поскольку всегда 0 ≤ r ≤ n, то число таких увеличений не может
превысить n.
- Таким образом, общее число повторений тела цикла while
оценивается через O(n), и рассматриваемый алгоритм имеет
сложность ϴ(n).