# Суффиксное дерево

**Суффиксное дерево** — это бор, содержащий все суффиксы заданной строки. В самой простейшей реализации его построение потребует O(n2) времени и памяти — мы просто будем добавлять в бор все суффиксы по одному, пока не получим то, что получим. Чаще всего, такой расход времени и памяти оказывается слишком большим

Если в кратце, **бор** — подвешенное дерево с символами на ребрах, реализация структуры данных для хранения строк. Строки получаются прохождением из корня по рёбрам, записывая соответствующие им символы, до терминальной вершины. 

Реализация **алгоритма Укконена** на Python:

In [1]:
# Определение узла в суффиксном дереве
class Node:
    def __init__(self, start, end):
        self.start = start  # Начало подстроки
        self.end = end  # Конец подстроки
        self.children = {}  # Дети узла в дереве


class SuffixTree:
    def __init__(self, s):
        self.s = s  # Строка, для которой строится дерево
        self.root = Node(-1, -1)  # Корневой узел дерева
        self.build()  # Построение дерева

    # Функция для построения суффиксного дерева
    def build(self):
        # Построение дерева для каждого суффикса строки
        for i in range(len(self.s)):
            self.add_suffix(i)

    # Функция для добавления суффикса в дерево
    def add_suffix(self, idx):
        cur = self.root  # Текущий узел, начинаем с корня
        i = idx  # Индекс в строке
        while i < len(self.s):
            # Если текущего символа нет среди детей, создаем новый узел
            if self.s[i] not in cur.children:
                cur.children[self.s[i]] = Node(i, len(self.s))
                break
            # Переходим по существующему ребру
            child = cur.children[self.s[i]]
            j = child.start
            while j < child.end and self.s[i] == self.s[j]:
                i += 1
                j += 1
            # Если дошли до конца ребра, переходим к следующему узлу
            if j == child.end:
                cur = child
            else:
                # Если суффикс не совпадает полностью, разбиваем ребро на два
                middle = Node(child.start, j)
                middle.children[self.s[j]] = Node(j, child.end)
                middle.children[self.s[i]] = Node(i, len(self.s))
                cur.children[self.s[child.start]] = middle
                break

    # Функция для вывода суффиксного дерева
    def print_tree(self, node, indent=0):
        if node.start == -1:
            print("Root")
        else:
            print(" " * indent, self.s[node.start:node.end])
        # Рекурсивный вызов для каждого потомка текущего узла
        for child in node.children.values():
            self.print_tree(child, indent + 4)


# Пример использования:
s = "abcab$"  # Строка, для которой строится суффиксное дерево
tree = SuffixTree(s)  # Создание экземпляра суффиксного дерева
tree.print_tree(tree.root)  # Вывод построенного суффиксного дерева

Root
     ab
         cab$
         $
     b
         cab$
         $
     cab$
     $


```
Root
    abcab$
    bcab$
    cab$
    ab$
    b$
```