Префиксное дерево

In [34]:
# Узел префексного дерева с атрибутами- потомок узла и флаг с окончанием слова
class TrieNode:
    def __init__(self):
        self.child = {}
        self.end = False

class Trie:
    def __init__(self):
        self.root = TrieNode()
    """
    Функция для вставки слова в дерево
    Если символ отсутствует в потомках узла-
    создается новый, в конце устанавливается флаг конца слова
    """
    def insert(self, word):
        node = self.root
        for char in word:
            if char not in node.child:
                node.child[char] = TrieNode()
            node = node.child[char]
        node.end = True


    def has_child(self, node):
        return bool(node.child)

    def search(self, word):
        node = self.root
        for char in word:
            # Возвращает False и none если слово не найдено
            if char not in node.child:
                return False, None
            node = node.child[char]

         #self.has_child(node) возвращается для проверки части слова
         #Возвращает true/false и слово
        return node.end or self.has_child(node), word

    def get_words_with_prefix(self, prefix):
        node = self.root

        # Перемещение по префиксу в дереве
        for char in prefix:
            if char not in node.child:

                #Если префикс не найден возвращается пустой список совпадений
                return []
            node = node.child[char]

        words = []

        # Рекурсивно получаем все слова, которые начинаются с заданного префикса
        self._get_words_from_node(node, prefix, words)
        return words

    def _get_words_from_node(self, node, prefix, words):
        if node.end:
            words.append(prefix)

        for char, child_node in node.child.items():
            self._get_words_from_node(child_node, prefix + char, words)

In [33]:
trie = Trie()

#добавление слов в дерево
trie.insert("куршавель")
trie.insert("кушать")
trie.insert("лежебока")
trie.insert("лежа")
trie.insert("Ольга")
trie.insert("океан")
trie.insert("округ")


# слова и префиксы, которые есть с дереве
print(trie.search("куршавель"))
print(trie.search("курш"))
print(trie.search("Оль"))
print(trie.search("лежебока"))

# слова которых нет в дереве
print(trie.search("лук"))
print(trie.search("мяу"))

# Возвращение всех слов начинающихся с заданного префикса
prefix = "ок"
words_with_prefix = trie.get_words_with_prefix(prefix)
print(words_with_prefix)

(True, 'куршавель')
(True, 'курш')
(True, 'Оль')
(True, 'лежебока')
(False, None)
(False, None)
['океан', 'округ']
