# 常用数据结构
- list
- queue
- set
- heap
- UnionFind Set
- Trie Tree

## queue
python内置多种队列，不考虑多线程这些东西，效率最高的是collection.deque，它是双向队列。

In [3]:
import collections

# 初始化
que = collections.deque([1, 2, 3, 4])
print("init deque: {}".format(que))
# pop
print("return and remove the leftmost item: {}".format(que.popleft()))
print("return and remove the rightmost item: {}".format(que.pop()))

# push
que.append(9)
print("右边添加一个新元素: {}".format(que))

# empty
que = collections.deque()
print("判断队列是否为空: {}".format(False if que else True))

# 集合操作
print("判断元素是否存在于队列中: {}".format(5 in que))

init deque: deque([1, 2, 3, 4])
return and remove the leftmost item: 1
return and remove the rightmost item: 4
右边添加一个新元素: deque([2, 3, 9])
判断队列是否为空: True
判断元素是否存在于队列中: False


## heap

堆，一般默认最小堆



In [14]:
import heapq

In [15]:
# 从空数组建立最小堆
heap = []
for i in [1,5,2,4,3]:
    heapq.heappush(heap, i)
    print(heap)

[1]
[1, 5]
[1, 5, 2]
[1, 4, 2, 5]
[1, 3, 2, 5, 4]


In [28]:
# 从数组建立最小堆
heap = [1,3,5,4,2,6]
heapq.heapify(heap)
print("堆: {}, 长度: {}".format(heap, len(heap)))

# 删除栈顶元素
top = heapq.heappop(heap)
print("删除堆顶元素{}，删除后堆:{}".format(top, heap))

# 返回top-k
print(heapq.nlargest(3, heap))
print(heapq.nsmallest(3, heap))

堆: [1, 2, 5, 4, 3, 6], 长度: 6
删除堆顶元素1，删除后堆:[2, 3, 5, 4, 6]
[6, 5, 4]
[2, 3, 4]


## 字典树

字典树(Trie Tree)是哈希树的变种。常用于统计、排序和保存大量的字符串。其优点为：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。字典树的基本性质：
1. 根节点不包含字符，除根节点外每一个节点都只包含一个字符；
2. 从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串；
3. 每个节点的所有子节点包含的字符都不相同。

在实现中，对于每个节点，保存一个标志位word，以表示从根节点到当前节点路径组成的字符串是否完整的出现过。例如，"abc, abcd, acbde"中，'ab'不算完整的出现，"abc"算完整的出现过。


In [1]:
'''
https://zhuanlan.zhihu.com/p/57342852
'''

from collections import defaultdict
class TrieNode:
    def __init__(self):
        """
        这里使用了collection.defaultdict，是dict的子类，其构造函数接受一个可调用对象，查找时如果找不到给定的键，就返回这个可调用对象。
        self.children = defaultdict(TrieNode) 即默认值为一个TrieNode。
        """
        self.children = defaultdict(TrieNode)
        self.word = False

class Trie:

    def __init__(self):
        """
        Initialize your data structure here.
        """
        self.root = TrieNode()



    def insert(self, word):
        """
        Inserts a word into the trie.
        :type word: str
        :rtype: void
        """
        cur = self.root
        for w in word:
            cur = cur.children[w]

        cur.word = True


    def search(self, word):
        """
        Returns if the word is in the trie.
        :type word: str
        :rtype: bool
        """
        cur = self.root
        for w in word:
            if w not in cur.children:
                return False
            cur = cur.children[w]
        if cur.word :
            return True
        return False



    def startsWith(self, prefix):
        """
        Returns if there is any word in the trie that starts with the given prefix.
        :type prefix: str
        :rtype: bool
        """
        cur = self.root
        for p in prefix:
            if p not in cur.children:
                return False
            cur = cur.children[p]
        return True
    
    def isTail(self, word):
        """
        返回该字符串是否为字典树的一条路径（直达叶子节点）
        :type word: str
        :rtype: bool
        """
        cur = self.root
        for w in word:
            if w not in cur.children:
                return False
            cur = cur.children[w]
        return len(cur.children) == 0


# Your Trie object will be instantiated and called as such:
obj = Trie()
obj.insert('abc')
param_2 = obj.search('ab')
param_3 = obj.startsWith('ab')
print('{}, {}'.format(param_2, param_3))

False, True
