# Trie

In [292]:
# Creation of node
class Trie():
    def __init__(self):
        self.root = Trie_node()
        
    def __str__(self):
        return '\n'.join(self.word_list())
        
    def word_list(self, current_node=None):
        if current_node is None:
            current_node = self.root
        if len(self.root.children)==0:
            return ''
        return_list = []
        # 如果目前node是end of string，則加入空白，好讓最後來新增目前的 chr
        if current_node.is_eos==True:
            return_list.append('')
        for child_node in current_node.children.values():
            return_list = return_list + self.word_list(child_node)
        # 針對每個 return_list 的元素的前面，都加上目前的 character
        for i in range(len(return_list)):
            return_list[i] = current_node.chr + return_list[i]
        return return_list
        
    def insert(self, string):
        current_node = self.root  # start from root
        for ch in string:
            # 如果沒在連結字典裡面，則新增
            if ch not in current_node.children:
                new_node = Trie_node(ch)  # 建立一個 trie node
                current_node.children[ch] = new_node  # 指定連結
                current_node = new_node  # 下一個
            else:
                current_node = current_node.children[ch]  # 藉由連結字典，移動到下一個 node
        current_node.is_eos = True  # 設定為一個字的結束
                
    # 尋找以 string 為開頭的所有單字
    def search(self, string):
        # initiate
        current_node = self.root
        for ch in string:
            if ch not in current_node.children:
                # 如果不在 children 裡面，則回報 false
                return False
            # 繼續下一個 node
            current_node = current_node.children[ch]
            
        # current node開始，回傳所有以 string 為開頭的entry
        search_list = []
        # 新增自己為單字
        if current_node.is_eos==True:
            search_list.append('')
        # 替每個 children搜尋
        for child in current_node.children.values():
            search_list = search_list + self.word_list(child)
        # 在所有字句前面加入搜尋的string
        for i in range(len(search_list)):
            search_list[i] = string + search_list[i]
        
        return search_list
            
        """        
        # 要檢查是不是 eos，如果不是eos，其實不在裡面，只是有重複的 character而已
        if current_node.is_eos==True:
            return True
        else:
            return False
        """


    
    def delete(self, string, node=None, index=0):
        no_left_child = False
        # 要尋找的 character
        ch = string[index] 
        if node is None:
            node = self.root
        # 從第0字元開始，看看有沒有在 children裡面，如果沒有則 raise exception 
        if ch not in node.children:
            raise Exception('The entry does not exist')
            
        # 比當對到最後一字元，看看儲存最後一個字元的node是否為 end of string
        # 如果不是，則表示沒有此單字
        if index==len(string)-1:
            if node.children[ch].is_eos==False:
                raise Exception('The entry does not exist')
            else:
                # 有的話，執行刪除，標記它不是 end of string
                node.children[ch].is_eos=False
        else:
            # 還沒到最後一個字元，判斷是否在字典裡 
            # 從下一個 node 裡面，尋找下一個character，index+1
            self.delete(string, node.children[ch], index+1)
        
        # 上面判斷是否存在還沒跑完之前，是不會到這裡來的
        # 當前面刪除的工作做完了之後，接下來輪到在上一層的 node進行清理
        # 每當有這種回到上一層的操作，就能使用 recursion
        if node.children[ch].is_eos==False and len(node.children[ch].children)==0:
            print(ch)
            del node.children[ch]
            
        
        # 也可以換個寫法，利用回傳no_left_child值判斷是否能刪除，比較精簡，也可以充分利用 recursion
        # 但是我覺得這樣要在刪除 chilren 之後的這裡以及剛剛標記 is_eos 的後面判斷兩次，比較囉嗦
        
        # 這裡刪完了會回到上一個的recurion呼叫部分，再接到上一個 node的這裡，檢視是否需要留下被刪除的那個entry
        # 比方說要刪除 love, 刪了 e會在v 的node裡面討論是不是需要刪除 children裡面的e
        # 如果 e本身不是當自己為, is_eos==False而且 e下面也沒有再接其他字了，也就是 e.child是空的，那可以刪除
        # 然後跳到 o node，會討論是否要刪 v node
        # 回到 l node，會討論是否刪除 o node
        # 回到 root node， 會討論是否要刪掉 l node
     
        
class Trie_node():
    def __init__(self, character=None):
        if character is None:
            character = ''
        self.chr = character
        self.children = {}  # 儲存跟下一個資料的連結
        self.is_eos = False  # 是否為 end of string

In [293]:
t = Trie()
t.insert('1')
t.insert('12')
t.insert('123')
t.insert('1234')
print(t)
print()
t.delete('1234')
print(t)

1
12
123
1234

4
1
12
123


In [289]:
t.root.children['1'].children['2'].children['3'].children

{}