# Грани

Определение. Грань строки – любой собственный префикс,
равный суффиксу.

- «Собственный» исключает грань, совпадающую со всей строкой
- Любая непустая строка имеет пустую грань (длины 0)
- Пример: строка ABAABABAABAAB содержит непустые грани: AB и
ABAAB

Свойства граней:
1) bp[0] = 0 (строка длины 1 имеет лишь собственную подстроку ε).
2) Если S[0..i] (0 < i < n) имеет грань k > 0, то S[0..i−1] имеет грань k −1.
Таким образом, bp[i] ≤ bp[i-1] + 1.
3) bp[i] = bp[i-1] + 1 ⟺ S[i] = S[bp[i-1]] (bp[i-1] – позиция справа от
префикса S[0..bp[i-1]-1] – наибольшей грани подстроки S[0..i-1]).
4) Если b – грань S, а b′ – грань b, то b′ есть грань S. Отсюда bp[bp[i]-1] –
длина второй по величине грани строки S[0..i] и т.д. Эта строго
убывающая последовательность заканчивается нулем.

In [1]:
from borders import *

## Сложность вычисления массива граней

- Цикл for повторяется ровно n – 1 раз, что при отсутствии
вложенных циклов составило бы ϴ(n)
- Вложенный цикл while обещает квадратичную сложность, однако
целесообразно оценить его общее количество выполнений
- Переменная bpRight принимает неотрицательные значения и
начинает с нуля. Увеличивается на ≤ 1 на каждом шаге for,
начиная со 2-го
- Каждый шаг while уменьшает значение bpRight на ≥1
- Общее число уменьшений (шагов цикла while за все время) ≤
общего числа увеличений, то есть n – 2, что дает O(n)
- Таким образом, вычислительная сложность рассматриваемого
алгоритма равна ϴ(n)

## Префиксы

Массив bp[0..n-1] для строки S содержит длины наибольших граней
всех ее подстрок S[0..i], i = 0, 1, …, n-1, то есть префиксов («префикс-функция») S.

In [2]:
bp = prefix_border_array("ABAABABAABAAB")
bp_mod = prefix_border_array_mod("ABAABABAABAAB", bp)
print(bp)
print(bp_mod)

[0, 0, 1, 1, 2, 3, 2, 3, 4, 5, 6, 4, 5]
[0, 0, 1, 0, 0, 3, 0, 1, 0, 0, 6, 0, 5]


## Суффиксы

In [3]:
bs = suffix_border_array("ABAABABAABAAB")
bs_mod = bs_to_bsm(bs, len(bs))
print(bs)
print(bs_mod)

[5, 4, 3, 2, 1, 5, 4, 3, 2, 1, 0, 0, 0]
[5, 0, 0, 0, 0, 5, 0, 0, 0, 0, 0, 0, 0]
