## Definição da estutura que vai formar as árvores TRIE para consulta

In [1]:
class TrieNode(object):

    
    def __init__(self, char: str):   # __init__ é um método especial para fazer construtores
        self.char = char   # caractere do nodo atual
        self.filhos = []   # nodos filhos
        self.pFinalizada = False   # se é o último nodo e a palavra terminou
        self.indices = []   # lista vazia para nodos que não são término de palavra
        ### não é um índice único e sim uma lista, pois podem existir títulos de música repetidos com mais de um artista

#### Operação que adiciona uma string na árvore trie

In [2]:
def addString(raiz, palavra: str, indice: int):   # função usada para adicionar uma palavra nova à estrutura trie

    nodo = raiz
    for char in palavra:
        encontradoEmFilho = False
        # busca pelo caractere nos filhos do nodo atual
        for filho in nodo.filhos:
            if filho.char == char: 
                nodo = filho   # apontamos o nodo para o filho que contém esse char
                encontradoEmFilho = True
                break
        
        if not encontradoEmFilho:   # se o caractere não foi encontrado, adiciona novo filho
            novoNodo = TrieNode(char)
            nodo.filhos.append(novoNodo)
            nodo = novoNodo   # apontamos, então, o nodo para seu novo filho e continuamos a iteração
    
    nodo.pFinalizada = True   # indica que até ali pode ser uma palavra (nome de música/artista completo)
    nodo.indices.append(indice)   # assinala o indice passado

#### Operação que procura uma string na árvore trie

In [3]:
def findString(raiz, palavra: str) -> (bool, []):
    """
      1. Se a palavra existe e tem algum índice associado, retorna verdadeiro e a lista de índices dela
      2. Se a palavra não existe, retorna falso e uma lista vazia
    """
    nodo = raiz

    if not raiz.filhos:   # se o nodo raiz não tiver nenhum filho, trivial, retorna falso
        return False, []
    for char in palavra:
        charNaoEncontrado = True
        for filho in nodo.filhos:
            if filho.char == char:
                charNaoEncontrado = False   # assinala que o char foi encontrado
                nodo = filho   # passa iteração para o nodo filho
                break
        
        if charNaoEncontrado:   # retorna falso quando não encontrar algum char da palavra sendo procurada
            return False, []
    
    # Caso passe por todos os caracteres sem retornar [False, []], então significa que a palavra foi encontrada
    # Resta saber se aquele nodo é um nodo final com um índice associado
    if nodo.pFinalizada:
        return True, nodo.indices
    else:
        return False, []

## Início do código em si

#### Leitura dos dados filtrados por ano

In [4]:
import pickle
import os

#Faz a leitura do arquivo de registros
with (open('teste.bin', 'rb')) as openfile:
    leitura = pickle.load(openfile)

#### Criação da TRIE para músicas e da TRIE para artistas

In [5]:
raizMusicas = TrieNode('@')   # raiz da trie de músicas 
raizArtistas = TrieNode('@')  # raiz da trie de artistas

indice = 0   # endereço da música no arquivo

for x in leitura:  
    # o str é necessário para os casos em que a música ou artista são apenas números e interpretados com inteiros
    addString(raizMusicas, str(x['Titulo']), indice)  
    addString(raizArtistas, str(x['Artista']), indice)
    indice += 1

##### Testes com as TRIE criadas

In [6]:
print(findString(raizMusicas, "All Of Me"), "\n")
print(findString(raizArtistas, "Train"), "\n")
print(findString(raizArtistas, "Train")[1], "\n")

(True, [10800]) 

(True, [7948, 8090, 8201, 8564, 8624, 9977, 10000, 10095, 10318, 10413, 10471]) 

[7948, 8090, 8201, 8564, 8624, 9977, 10000, 10095, 10318, 10413, 10471] 



In [8]:
print(leitura[10800])

{'Artista': 'John Legend', 'Titulo': 'All Of Me', 'Ano': 2014, 'Pontos': 4069, 'Peak': 100, 'Semanas': 59}


#### Salvando os dados das TRIE em arquivos binários

In [9]:
filename = "trieMusicas.bin"
with (open(filename, 'wb+')) as openfile: #abre o arquivo de teste no modo de leitura binaria 'wb' como openfile
    pickle.dump(raizMusicas, openfile)
    
filename = "trieArtistas.bin"
with (open(filename, 'wb+')) as openfile: #abre o arquivo de teste no modo de leitura binaria 'wb' como openfile
    pickle.dump(raizArtistas, openfile)

#### Testando arquivos salvos:

In [10]:
filename = "trieMusicas.bin"

if os.path.exists(filename): #confere se o arquivo existe
    with open(filename,'rb') as openfile:  #with automaticamente da um close() no final
        trieMusicas = pickle.load(openfile)
        
filename = "trieArtistas.bin"
if os.path.exists(filename): #confere se o arquivo existe
    with open(filename,'rb') as openfile:  #with automaticamente da um close() no final
        trieArtistas = pickle.load(openfile)
        
print(findString(trieMusicas, "All Of Me"), "\n")
print(findString(trieArtistas, "Train")[1], "\n")

(True, [10800]) 

[7948, 8090, 8201, 8564, 8624, 9977, 10000, 10095, 10318, 10413, 10471] 

