Arvore Trie, Bruno Oliveira Andrade

In [None]:
class Node:
    def __init__(self,label=None,data=None):
        self.label=label
        self.data=data
        self.children={}
    
    def addChild(self,key,data=None):
        if not isinstance(key,Node):
            self.children[key] = Node(key,data)
        else:
            self.children[key.label]=key
    
    def __getitem__(self,key):
        return self.children[key]

class Trie:
    def __init__(self):
        self.head=Node()
    def __getitem__(self,key):
        return self.head.children[key]
    # adiciona a word no graph e faz a trie
    def add(self,word):
        current_node=self.head
        word_finished = True
        for i in range(len(word)):
            if word[i] in current_node.children:
                current_node = current_node.children[word[i]]
            else:
                word_finished=False
                break
        
        # Pra cada word, cria um novo filho
        if not word_finished:
            while i < len(word):
                current_node.addChild(word[i])
                current_node=current_node.children[word[i]]
                i+=1
        # Armazena a palavra completa no nó final para não ter q voltar
        current_node.data = word

    # Checa se a trie tem essa palavra
    def has_word(self,word):
        if word == '':
            return False
        if word == None:
            raise ValueError('Trie.has_word requer uma string não nula')
         # Começa do topo
        current_node=self.head
        exists = True
        for letter in word:
            if letter in current_node.children:
                current_node = current_node.children[letter]
            else:
                exists = False
                break
        return exists
    

    def start_with_prefix(self,prefix):
        """ Retorna uma lista de todas as palavras na árvore que começam com o prefixo """
        words=list()
        if prefix == None:
            raise ValueError('Requer prefixo não nulo')
                
        # Determinar nó de fim de prefixo
        top_node=self.head
        for letter in prefix:
            if letter in top_node.children:
                top_node = top_node.children[letter]
            else:
                # Prefixo não contem na trie
                return words
        # Obter palavras sob prefixo
        # Printa todas as palavras do dict
        if top_node == self.head:
            #Printa valor do dict
            queue = [node for key,node in top_node.children.items()]
        else:
            queue = [top_node]
        # Fila como uma lista de ramificações a serem percorridas
        # Realize uma primeira pesquisa do prefixo
        # uma lista de palavras ordenadas em crescente
        while queue:
            current_node = queue.pop()
            if current_node.data != None:
                words.append(current_node.data)
            queue = [node for key,node in current_node.children.items()] + queue
        return words       

    
    def getData(self, word):
        """ Retorna o 'data' do nó identificado dado pelo word """
        if not self.has_word(word):
            raise ValueError('{} Não encontrado na trie'.format(word))
        current_node = self.head
        for letter in word:
            current_node = current_node[letter]  
        return current_node.data

if __name__ == '__main__':
    """ Exemplo de uso """
    trie = Trie()
    words = 'ola, você sabe q o sabio soube saber que o sabiá sabia assobiar?'
    for word in words.split():
        trie.add(word)
 

In [None]:
print(trie.has_word('ola'))

True


In [None]:
#teste com prefixo 'sa'
print(trie.start_with_prefix('sa'))

['saber', 'sabia', 'sabiá', 'sabio']


In [None]:
#Adicionando uma palavra com 'sa' para testar o add
trie.add('samba')

In [None]:
print(trie.start_with_prefix('sa'))

['samba', 'saber', 'sabia', 'sabiá', 'sabio']
