# Префиксное дерево (trie, prefix tree, луч, нагруженное дерево, бор)

* [Префиксное дерево](https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%B5%D1%84%D0%B8%D0%BA%D1%81%D0%BD%D0%BE%D0%B5_%D0%B4%D0%B5%D1%80%D0%B5%D0%B2%D0%BE)
* [Tries (Prefix Trees)](https://www.baeldung.com/cs/tries-prefix-trees)
* [Префиксное дерево (trie)](https://habr.com/ru/companies/otus/articles/674378/)
* [Префиксные деревья](https://ru.hexlet.io/courses/algorithms-trees/lessons/prefix/theory_unit)

## Общая информация

Префиксное дерево — структура данных, позволяющая хранить ассоциативный массив, ключами которого чаще всего являются строки. Представляет собой дерево поиска, каждое ребро которого помечено каким-то символом так, что для любого узла все рёбра, соединяющие этот узел с его потомками, помечены разными символами. 

Префиксные деревья могут использоваться, например, для реализации множеств и ассоциативных массивов, но наиболее полезны они при обходе и поиске ключей, начинающихся с определенного префикса (например, при автодополнениях).

<img src="pictures/trie_example.png" width=350 height=350 />

Ключ в префиксном дереве, идентифицирующий конкретный узел дерева, не явно хранится в данном узле, а задаётся положением данного узла в дереве. Получить ключ можно выписыванием подряд символов, помечающих рёбра на пути от корня до узла. Ключ корня дерева — пустая строка. 

Некоторые узлы префиксного дерева выделены (на рисунке они подписаны цифрами). В таких узлах хранятся действительные ключи; они помечены булевым флагом. Считается, что префиксное дерево содержит данную строку-ключ тогда и только тогда, когда эту строку можно прочитать на пути из корня до некоторого (единственного для этой строки) выделенного узла. Иногда также удобно считать все узлы дерева выделенными. Часто в выделенных узлах хранят дополнительную информацию, связанную с ключом, и обычно выделенными являются только листья и, возможно, некоторые внутренние узлы.

In [1]:
class TrieNode:
    def __init__(self, value=''):
        self.value = value
        self.children = {}
        self.is_end_of_word = False

class Trie:
    def __init__(self):
        self.root = TrieNode('')

    def insert(self, word):
        node = self.root
        for char in word:
            if char not in node.children:
                node.children[char] = TrieNode(char)
            node = node.children[char]
        node.is_end_of_word = True

    def search_with_key(self, key_word):
        node = self.root
        for char in key_word:
            if char in node.children:
                node = node.children[char]
            else:
                return False
        return node.is_end_of_word

    def search_with_prefix(self, prefix):
        node = self.root
        for char in prefix:
            if char in node.children:
                node = node.children[char]
            else:
                return False
        return True

    def delete(self, word):
        def _delete(node, word, index):
            if index == len(word):
                if node.is_end_of_word:
                    node.is_end_of_word = False
                    if not node.children:
                        return True
                    return False
                return False

            char = word[index]
            if char not in node.children:
                return False

            child_node = node.children[char]
            delete_child = _delete(child_node, word, index + 1)

            if delete_child:
                del node.children[char]
                if not node.children and not node.is_end_of_word:
                    return True
            return False

        _delete(self.root, word, 0)

In [2]:
trie = Trie()
words = ["apple", "banana", "apricot", "apartment", "ape", "bee"]
for word in words:
    trie.insert(word)

In [3]:
print(trie.search_with_key("apple"))
print(trie.search_with_key("pear"))

True
False


In [4]:
trie.delete("apricot")

In [5]:
print(trie.search_with_prefix("ap"))
print(trie.search_with_prefix("ban"))

True
True


## Сжатые префиксные деревья

В сжатых префиксных деревьях в вершине хранится не символ, а последовательность символов - префикс. Такая структура храненя информации существенно уменьшает количество переходов между вершинами и подходит для информации, которая не очень часто изменяется.

Поддерживает те же операции, однако в них дополнительно должно быть реализовано сравнение подстрок.