## trie树

In [None]:
"""
题目1：trie树建立
题目描述：实现一个 Trie (前缀树)，包含 insert, search, 和 startsWith 这三个操作。
    示例:
    Trie trie = new Trie();
    trie.insert("apple");
    trie.search("apple");   // 返回 true
    trie.search("app");     // 返回 false
    trie.startsWith("app"); // 返回 true
    trie.insert("app");   
    trie.search("app");     // 返回 true
    说明:
    你可以假设所有的输入都是由小写字母 a-z 构成的。
    保证所有输入均为非空字符串。
解题思路：
（1）根节点root
（2）共享前缀中也存在可能是字符串的节点，要在该节点做好标记
"""

In [44]:
from collections import defaultdict

"""
树的节点，要具备的属性
（1）孩子节点为一个dic，因为孩子可能不止一个
（2）该节点是否为某个单词的结尾
"""
class Node:
    def __init__(self):
        self.children = defaultdict(Node)
        self.isWord = False
"""
Trie树对象
"""
class Trie(object):
    def __init__(self):
        # 保存根节点
        self.root = Node()
    
    """
    1）插入函数：
    （1）建立根节点root
    （2）遍历字符串，根节点指向新节点
    （3）依次进行
    """
    def insert(self,string):
        # 指针指向根节点
        current = self.root
        # 遍历字符串插入
        for i in string:
            """
            注意：current.children 是一个dic，类型defaultdict(Node)
                  current.children[i]返回的是上面dic中key为i对应的value值，
                  关键点：如果dic中不存在key：i，则返回一个默认的Node对象
            """
            # 找到current.children这个dic中key为i所对应的那个children
            children = current.children[i]
            # 该children节点为当前节点，也可以理解为：指针指向该children节点
            current = children
        # 最后一个字符为存入的该单词的末尾字符，将其"单词标志属性"置为True
        current.isWord = True
        
    """
    查找函数：
    （1）是指trie树中，有当时保存的单词。
         例如：trie树保存'abcd'、'ab',则查找单词'ab'则返回TRUE,查找单词'abc'则返回False
    （2）从根节点开始查找
    """
    def search(self,word):
        # trie树指针，初始时指向根节点
        trie_p = self.root
        # 遍历查找
        # word_p 作为指向 word 的指针
        word_p = 0
        while word_p < len(word):
            # 如果 data_p 指向的字符在trie_p指向的节点的下一层子节点中，继续遍历
            if word[word_p] in trie_p.children.keys():
                # trie 树指针指向该字符对应的其孩子节点
                trie_p = trie_p.children[word[word_p]]
                # data 指针移到下一个
                word_p += 1
            else:
                return False
        """
        注意：下面必须有trie_p.isWord is True，因为该单词必须曾经存入过
        """
        if word_p == len(word) and trie_p.isWord is True:
            return True
        else:
            return False
    
    """
    前缀查找函数：如'ab'
    （1）指trie树中是否有以该字符串'ab'为前缀的单词，'a'不要求一定从root下的根节点开始
    （2）'b'也不要求一定是存入某个单词的结尾，即：'b'对应的trie树节点的 isWord 属性为TRUE
    """
    def startsWith(self,prefix):
        # trie树指针，初始时指向根节点
        trie_p = self.root
        # 遍历查找
        # prefix_p 作为指向 prefix 的指针
        prefix_p = 0
        while prefix_p < len(prefix):
            # 如果 data_p 指向的字符在trie_p指向的节点的下一层子节点中，继续遍历
            if prefix[prefix_p] in trie_p.children.keys():
                # trie 树指针指向该字符对应的其孩子节点
                trie_p = trie_p.children[prefix[prefix_p]]
                # data 指针移到下一个
                prefix_p += 1
            else:
                return False
        self.trie_p = trie_p
        """
        注意：下面必须有trie_p.isWord is True，因为该单词必须曾经存入过
        """
        if prefix_p == len(prefix) :
            return True
        else:
            return False

In [137]:
"""
Trie树解法2：将Trie树当成图graph来做
解题思路：
（1）graph是一个dic，默认每个key对应value为一个dic（默认每个value对应 0 ），
    其中，key含义：某个字符，value（dic）：为该字符下面所有的下一个字符集合词典
    value（dic）中dic表示：每个节点是否为某个单词的结尾，如果是结尾，则对应value值改为 1 ，否则还是原来的 0 
    例如：插入两个单词'abc','abd'，则生成的graph
    {
    'root':{'a':0},
    'a':{'b':0},
    'b':{'c':1,'d':1},
    'c':{},
    'd':{}
    }
"""
from collections import defaultdict

class newTrie(object):
    def __init__(self):
        self.graph = defaultdict(dict)
        self.root = self.graph['root']
        self.graph['root'] = defaultdict(int)
    
    def insert(self,data):
        # 从根节点开始
        current = self.graph['root']
        # 开始遍历
        for i in data:
            # 将 i 插入current的孩子词典中
            current[i]
            # 将 i 插入graph中
            if type(self.graph[i]) is not defaultdict:
                self.graph[i] = defaultdict(int)
            if i == data[-1]:
                current[i] = 1
            # 移动指针
            current = self.graph[i]
    
    def search(self, word):
        # trie树指针，初始时指向根节点
        trie_p = self.graph['root']
        # 遍历查找
        # word_p 作为指向 word 的指针
        word_p = 0
        while word_p < len(word):
            # 如果 data_p 指向的字符在trie_p指向的节点的下一层子节点中，继续遍历
            if word[word_p] in trie_p.keys():
                # trie 树指针指向该字符对应的其孩子节点
                trie_p = self.graph[word[word_p]]
                # data 指针移到下一个
                word_p += 1
            else:
                return False
        self.trie_p = word_p
        """
        注意：下面必须有trie_p.isWord is True，因为该单词必须曾经存入过
        """
        if word_p == len(word) and self.graph[word[word_p - 2]][word[word_p - 1]] == 1:
            return True
        else:
            return False
    
    def startsWith(self, prefix):
        # trie树指针，初始时指向根节点
        trie_p = self.graph['root']
        # 遍历查找
        # word_p 作为指向 word 的指针
        prefix_p = 0
        while prefix_p < len(prefix):
            # 如果 data_p 指向的字符在trie_p指向的节点的下一层子节点中，继续遍历
            if prefix[prefix_p] in trie_p.keys():
                # trie 树指针指向该字符对应的其孩子节点
                trie_p = self.graph[prefix[prefix_p]]
                # data 指针移到下一个
                prefix_p += 1
            else:
                return False
        """
        注意：下面必须有trie_p.isWord is True，因为该单词必须曾经存入过
        """
        if prefix_p == len(prefix):
            return True
        else:
            return False

In [138]:
newtrie = newTrie()
newtrie.insert('abb')

In [125]:
newtrie.insert('ab')

In [133]:
newtrie.search('ab')

False

In [118]:
print(newtrie.trie_p)

None


In [139]:
newtrie.graph

defaultdict(dict,
            {'root': defaultdict(int, {'a': 0}),
             'a': defaultdict(int, {'b': 1}),
             'b': defaultdict(int, {'b': 1})})

In [41]:
trie = Trie()
trie.insert('abc')

In [33]:
trie.insert('ab')

In [43]:
trie.search('ab')

False

In [27]:
trie.trie_p.children

defaultdict(__main__.Node, {'c': <__main__.Node at 0x52ed9a2e80>})

In [14]:
'a' in trie.root.children.keys()

True