# 二分搜索树
- 本节实现的二分搜索树不包含重复元素
- 二分搜索树树中存储的元素必须支持元素间的比较操作

In [2]:
# @time: 2019-04-05 01:31
from collections import deque
import random

In [3]:
class Node:
    def __init__(self, elem):
        """节点类构造函数"""
        self.elem = elem
        self.left = self.right = None

In [4]:
class Bst:
    def __init__(self):
        """二分搜索树的构造函数"""
        self.root = None
        self.size = 0
        
    def getSize(self):
        """获取元素数目"""
        return self.size
    
    def isEmpty(self):
        """判空"""
        return self.size == 0
    
    def check_empty(self):
        """
        检查当前二分搜索树是否为空
        Returns:
            空就报错
        """
        if self.isEmpty():
            raise Exception('Empty queue!')
    
    def add(self, new_elem):
        """
        向二分搜索树插入元素elem
        O(logn)
        Params:
            - elem: 待插入的元素
        """
        # 返回插入元素后的新的根节点
        self.root = self._add(self.root, new_elem)
    
    def contains(self, elem):
        """
        查看某一元素是否存在于bst中
        O(logn)
        Returns:
            存在返回True,否则为False
        """
        return self._contains(self.root, elem)
    
    def preOrder(self):
        """
        二分搜索树的前序遍历
        O(n)
        前序遍历、中序遍历以及后续遍历是针对当前的根节点来说的。前序就是把对根节点的操作放在遍历左、右子树的前面，相应的中序遍历以及后序遍历以此类推
        前序遍历是最自然也是最常用的二叉搜索树的遍历方式
        """
        self._preOrder(self.root)
        
    def preOrder_nr(self):
        """
        前序遍历的非递归写法
        此时需要借助一个辅助的数据结构————栈
        O(n)
        技巧：压栈的时候先右孩子，再左孩子，从而左孩子先出栈。
        """
        # 前序遍历的非递归写法
        if self.isEmpty():
            return
        stack = [self.root]
        while len(stack):
            tmp_node = stack.pop()
            print(tmp_node.elem, end=' ')
            if tmp_node.right:
                stack.append(tmp_node.right)
            if tmp_node.left:
                stack.append(tmp_node.left)
        
    def inOrder(self):
        """
        二分搜索树的中序遍历
        O(n)
        特点：输出的元素是从小到大排列的，因为先处理左子树，到底后再处理当前节点，最后再处理右子树，而左子树的值都比当前节点小，
              右子树的值都比当前节点大，所以是排序输出
        """
        # 输出结果从小到大排列
        self._inOrder(self.root)
        
    def postOrder(self):
        """
        二分搜索树的后序遍历
        应用场景：二叉搜索树的内存回收，例如C++中的析构函数
        O(n)
        """
        # 用于析构函数，内存释放等
        self._postOrder(self.root)
        
    def levelOrder(self):
        """
        层序遍历（广度优先遍历）
        O(n)
        常用于算法设计中--无权图最短路径
        """
        if self.isEmpty():
            return
        d = deque()
        d.append(self.root)
        while len(d):
            tmp_node = d.popleft()
            print(tmp_node.elem, end=' ')
            if tmp_node.left:
                d.append(tmp_node.left)
            if tmp_node.right:
                d.append(tmp_node.right)
                
    def minimum(self):
        """
        返回当前二叉搜索树的最小值
        O(n)
        Returns:
            当前树中的最小值
        """
        self.check_empty()
        return self._minimum(self.root).elem
    
    def maximum(self):
        """
        返回当前二叉搜索树的最大值
        O(logn)
        Returns:
            当前树中的最大值
        """ 
        self.check_empty()
        return self._maximum(self.root).elem
    
    def removeMin(self):
        """
        删除当前二叉搜索树的最小值的节点
        O(logn)
        Returns: 
            被删除节点所携带的元素的值
        """
        self.check_empty()
        self.root = self._removeMin(self.root)
    
    def removeMax(self):
        """
        删除当前二叉搜索树的最大值的节点
        O(logn)
        Returns: 
            被删除节点所携带的元素的值
        """
        self.check_empty()
        self.root = self._removeMax(self.root)
        
    def remove(self, elem):
        """
        删除二叉搜索树中值为elem的节点，注意我们的二叉搜索树中的元素的值是不重复的，所以删除就是真正的删除，无残余
        这个算法是二叉搜索树中最难的一个算法
        时间复杂度：O(logn)
        Params:
            - elem: 待删除的元素
        """
        self.check_empty()
        self.root = self._remove(self.root, elem)
    
    # private
    def _add(self, node, new_elem):
        """
        向以Node为根的二分搜索树插入元素elem，递归算法，这个根可以是任意节点哦，因为二分搜索树的每一个节点都是一个新的二分搜索树的根节点
        O(logn)
        Params:
            - Node: 根节点
            - elem: 带插入元素
        Returns:
            插入新节点后二分搜索树的根
        """
        if node is None:
            self.size += 1
            return Node(new_elem)
        
        if node.elem < new_elem:
            node.right = self._add(node.right, new_elem)
        elif new_elem < node.elem:
            node.left = self._add(node.left, new_elem)
        # 如果相等，我们什么都不做，即不包含重复元素
        return node
    
    def _contains(self, node, elem):
        """
        在以node为根的二叉搜索树中查询是否包含元素elem
        O(logn)
        Params:
            - node:    根节点
            - elem:    带查找元素
        Returns:
            bool值，存在为True
        """
        if node is None:
            return False
        
        if node.elem < elem:
            return self._contains(node.right, elem)
        elif elem < node.elem:
            return self._contains(node.left, elem)
        else:
            return True
        
    def _preOrder(self, node):
        """
        对以node为根的节点的二叉搜索树的前序遍历
        O(n)
        Params:
            - node: 当前根节点
        """
        if node is None:
            return 
        print(node.elem, end=' ')
        self._preOrder(node.left)
        self._preOrder(node.right)
        return
    
    def _inOrder(self, node):
        """
        对以node为根节点的二叉搜索树的中序遍历
        O(n)
        Params:
            - node: 当前根节点
        """
        if node is None:
            return 
        self._inOrder(node.left)
        print(node.elem, end=' ')
        self._inOrder(node.right)
        
    def _postOrder(self, node):
        """
        对以node为根节点的二叉搜索树的后序遍历
        O(n)
        Params:
            - node: 当前根节点
        """
        if node is None:
            return
        self._postOrder(node.left)
        self._postOrder(node.right)
        print(node.elem, end=' ')
        
    def _minimum(self, node):
        """
        返回以node为根的二叉搜索树携带最小值的节点
        O(logn)
        """
        if node.left is None:
            return node
        return self._minimum(node.left)
            
    def _maximum(self, node):
        """
        返回以node为根的二叉搜索树携带最大值的节点
        O(logn)
        """
        if node.right is None:
            return node
        return self._maximum(node.right)
    
    def _removeMin(self, node):
        """
        删除以node为根节点的二叉搜索树携带最小值的节点
        O(logn)
        Returns: 
            删除后的二叉搜索树的根节点，与添加操作有异曲同工之处
        """
        if node.left is None:
            tmp_node = node.right
            node.right = None
            self.size -= 1
            return tmp_node
        node.left = self._removeMin(node.left)
        return node
    
    def _removeMax(self, node):
        """
        删除以node为根节点的二叉搜索树携带最大值的节点
        O(logn)
        Returns: 
            删除后的二叉搜索树的根节点，与添加操作有异曲同工之处
        """
        if node.right is None:
            tmp_node = node.left
            node.left = None
            self.size -= 1
            return tmp_node
        node.right = self._removeMax(node.right)
        return node
    
    def _remove(self, node, elem):
        """
        删除以node为根节点的二叉搜索树中携带值为elem的节点
        不存在的话什么也不做
        O(logn)
        Returns: 
            删除节点后的二叉搜索树的根节点
        """
        if node is None:
            return 
        if node.elem < elem:
            node.right = self._remove(node.right, elem)
            return node
        elif elem < node.elem:
            node.left = self._remove(node.left, elem)
            return node
        else:
            if node.left is None:
                tmp_node = node.right
                node.right - None
                self.size -= 1
                return tmp_node
            elif node.right is None:
                tmp_node = node.left
                node.left = None
                self.size -= 1
                return tmp_node
            else:
                # 这里采用node的后继节点
                successor = self._minimum(node.right)
                successor.right = self._removeMin(node.right)
                self.size += 1 # 要被真正删除的是node,此时已经将successor删除了，所以要补回来1个size
                successor.left = node.left
                node.left = node.right = None
                self.size -= 1
                return successor

In [5]:
# test Bst
test = Bst()
nums = [20, 30, 10, 15, 40, 70, 60, 17, 25]
for elem in nums:
    test.add(elem)
    
#       20
#      /  \
#     10  30
#      \  / \
#     15 25 40
#       \    \
#       17   70
#            /
#           60
print('前序遍历(递归版本)-----', end=' ')
test.preOrder() 
print('\n前序遍历(非递归版本)-----', end=' ')
test.preOrder_nr() 
print('\n中序遍历-----', end=' ')
test.inOrder() 
print('\n后序遍历-----', end=' ')
test.postOrder() 
print('\n层序遍历-----', end=' ')
test.levelOrder()
print('\n是否包含元素60？-----', test.contains(70))
print('二叉树中的最小值为-----', test.minimum(), '最大值为-----', test.maximum())
print('删除最小值后的层序遍历-----', end=' ')
test.removeMin()
test.levelOrder()
print('\n删除最大值后的层序遍历-----', end=' ')
test.removeMax()
test.levelOrder()
print('\n删除30后的层序遍历-----', end=' ')
test.remove(30)
test.levelOrder()

前序遍历(递归版本)----- 20 10 15 17 30 25 40 70 60 
前序遍历(非递归版本)----- 20 10 15 17 30 25 40 70 60 
中序遍历----- 10 15 17 20 25 30 40 60 70 
后序遍历----- 17 15 10 25 60 70 40 30 20 
层序遍历----- 20 10 30 15 25 40 17 70 60 
是否包含元素60？----- True
二叉树中的最小值为----- 10 最大值为----- 70
删除最小值后的层序遍历----- 20 15 30 17 25 40 70 60 
删除最大值后的层序遍历----- 20 15 30 17 25 40 60 
删除30后的层序遍历----- 20 15 40 17 25 60 

# 用二分搜索树实现一个集合
- 注意上面实现的bst不容纳重复元素，所以是一个很好的集合的例子

In [6]:
# 实现起来非常的简单，全都是bst实现了的内置方法
class BstSet:
    def __init__(self):
        """集合构造函数"""
        self.data = Bst()
        # data里面内置了getSize()方法，所以就不用size成员变量了
    
    def getSize(self):
        """获取集合大小"""
        return self.data.getSize()
    
    def isEmpty(self):
        """判空"""
        return self.data.isEmpty()
    
    def add(self, elem):
        """
        向集合中添加元素
        Params:
            - elem: 待添加元素
        """
        self.data.add(elem)
        
    def contains(self, elem):
        """
        判断集合中是否包含某以元素
        Params:
            - elem: 待查询元素
        Returns:
            存在返回True，否则为False
        """
        return self.data.contains(elem)
    
    def remove(self, elem):
        """
        从集合中删除一个元素，若不存在什么也不做
        Params:
            - elem: 待删除元素
        """
        self.data.remove(elem)
        
    def print_(self):
        """对集合中的元素进行打印"""
        self.data.inOrder()  # 中序遍历吧，此时从小到大排列，比较舒服，当然，其他遍历方法随意

In [7]:
# test BstSet
nums = [10, 20, 30, 30, 30, 30, 15, 26, 77]
test_set = BstSet()
print('将nums数据中的数据添加进集合-----', end=' ')
for elem in nums:
    test_set.add(elem)
test_set.print_()
print('\n集合的size-----', test_set.getSize())
print('是否包含元素77？-----', test_set.contains(77))
print('将元素30从集合中移除-----', end=' ')
test_set.remove(30)
test_set.print_()

将nums数据中的数据添加进集合----- 10 15 20 26 30 77 
集合的size----- 6
是否包含元素77？----- True
将元素30从集合中移除----- 10 15 20 26 77 

# 用二分搜索树实现一个字典（映射）
- 由于需要节点盛放两个元素，所以很多东西要修改一下，但是思想还是一致的

In [8]:
# 注意Node的key必须支持比较操作
class Node_map:
    def __init__(self, k, v):
        """
        字典中节点类的构造函数
        Params:
            k: 键
            v: 键所对应的value值
        """
        self.key = k
        self.value = v
        self.left = self.right = None

In [9]:
class BstMap:
    def __init__(self):
        """字典构造函数"""
        self.root = None
        self.size = 0
        
    def getSize(self):
        """获取字典大小"""
        return self.size
    
    def isEmpty(self):
        """判空"""
        return self.size == 0
    
    def add(self, k, v):
        """
        向字典中添加某一键值对
        Params:
            - k: 新的键
            - v: 新的键所对应的值
        """
        self.root = self._add(self.root, k, v)
        
    def minimum(self):
        """
        获取字典中最小的键及其value
        Returns:
            一个tuple，第一个元素为键，第二个元素为键所对应的value
        """
        if self.isEmpty():
            raise Exception('Empty map!')
        ret_node = self._minimum(self.root)
        return ret_node.key, ret_node.value
    
    def removeMin(self):
        """删除字典中键最小的那个键值对，并对字典中的根节点进行相应的更新"""
        if self.isEmpty():
            raise Exception('Empty map!')
        self.root = self._removeMin(self.root)
        
    def remove(self, k):
        """
        删除字典中键为k的键值对，并对字典中的根节点进行相应的更新
        Params:
            - k: 待删除键值对的key
        """
        self.root = self._remove(self.root, k)
        
    def contains(self, k):
        """
        查询当前的字典中是否包含键k
        Params:
            k: 待查询的键
        Returns:
            存在返回True，否则返回False
        """
        return self._getnode(self.root, k) is not None
        
    def set(self, k, v):
        """
        将字典中键为k的键值对的值设为新值
        Params:
            - k: 待设定的key
            - v: 新的value
        """
        # 此时用户已经明确的直到了键k存在于字典中，否则报错
        dst_node = self._getnode(self.root, k)
        if not dst_node:
            raise Exception('The key:{} is not in the map!'.format(k))
        dst_node.value = v
        
    def get(self, k):
        """
        获取字典中键为k的value，不存在则返回None
        Params:
            - k: 输入的key值
        """
        dst_node = self._getnode(self.root, k)
        if not dst_node:
            return None
        return dst_node.value
        
    def print_(self):
        """打印字典中的所有元素，这里我采用广度优先遍历来打印字典了""" 
        print('[', end=' ')
        if self.isEmpty():
            return
        d = deque()
        d.append(self.root)
        while len(d):
            tmp_node = d.popleft()
            print('{}-->{}'.format(tmp_node.key, tmp_node.value), end=', ')
            if tmp_node.left:
                d.append(tmp_node.left)
            if tmp_node.right:
                d.append(tmp_node.right)
        print(']')
        
    # private
    def _add(self, node, k, v):
        """
        向以node为根的字典中添加键值对
        Params:
            - k: 待添加键值对的key
            - v: 待添加键值对的value
        Returns:
            新的根节点
        """
        if node is None:
            self.size += 1
            return Node_map(k, v)
        
        if k < node.key:
            node.left = self._add(node.left, k, v)
        elif node.key < k:
            node.right = self._add(node.right, k, v)
        else:
            node.value = v  # 此时node.key==k，就对它的值进行更新就可以了
        return node
    
    def _minimum(self, node):
        """
        找到以node为根节点的字典携带最小key的节点
        Params:
            - node: 输入的根节点
        Returns:
            携带最小key的节点
        """
        if not node.left:
            return node
        return self._minimum(node.left)
    
    def _removeMin(self, node):
        """
        删除以node为根节点的字典携带最小key的节点
        Params:
            - node: 输入的根节点
        Returns:
            携带最小key的节点
        """
        if not node.left:
            tmp_node = node.right
            node.right = None
            self.size -= 1
            return tmp_node
        node.left = self._removeMin(node.left)
        return node
    
    def _remove(self, node, k):
        """
        删除以node为根节点的字典键为k的节点
        Params:
            - node: 输入的根节点
            - k: 待删除的key
        Returns:
            新的根节点
        """
        if node is None:
            return 
        
        if k < node.key:
            node.left = self._remove(node.left, k)
            return node
        elif node.key < k:
            node.right = self._remove(node.right, k)
            return node 
        else:
            if node.left is None:
                tmp_node = node.right
                node.right = None
                self.size -= 1
                return tmp_node
            elif node.right is None:
                tmp_node = node.left
                node.left = None
                self.size -= 1
                return tmp_node
            else:
                successor_node = self._minimum(node.right)
                successor_node.right = self._removeMin(node.right)
                self.size += 1
                successor_node.left = node.left
                node.left = node.right = None
                self.size -= 1
                return successor_node
            
    def _getnode(self, node, k):
        """
        根据某一个key在以node为根节点的字典中寻找到相应的节点
        Params:
            - node: 输入的根节点
            - k: 待查询的key
        Returns:
            返回携带对应键的Node，若不存在返回None
        """
        # 因为get和set方法都需要定位到某一个节点，所以这里写一个小函数来定位一个以node为根节点的map中键为k的节点
        if node is None:
            return None
        if k < node.key:
            return self._getnode(node.left, k)
        elif node.key < k:
            return self._getnode(node.right, k)
        else:
            return node

In [10]:
# test BstMap
random.seed(7)
test_map = BstMap()
key_nums = [i for i in range(1, 10)]
random.shuffle(key_nums)
value_nums = [chr(i) for i in range(65, 73)]
random.shuffle(value_nums)
nums = [(i, j) for (i, j) in zip(key_nums, value_nums)]
random.shuffle(nums)
print('待添加的key,value-----', nums)
print('将它们添加进字典中-----', end=' ')
#              3(F) 
#           /      \
#       1(G)       8(H)
#        \         /   \ 
#        2(D)     7(C)  9(A)
#                /
#               5(B)
#              /
#             4(E)
for elem in nums:
    test_map.add(*elem)
test_map.print_()
print('用add方法对已存在的键相应的值进行更新，将7的值设为666-----', end=' ')
test_map.add(7, 666)
test_map.print_()
print('将键为7的键值对从字典中删除-----', end=' ')
test_map.remove(7)
test_map.print_()
print('将键为8的值设为"hahaha"-----', end=' ')
test_map.set(8, 'hahaha')
test_map.print_()
print('获取键为8的相应的值-----', test_map.get(8))
print('此时的size-----', test_map.getSize())
print('最小的键为-----', test_map.minimum()[0])
print('将最小的键所在的键值对删除-----', end=' ')
test_map.removeMin()
test_map.print_()
print('此时字典中是否包含键为9的键值对？-----', test_map.contains(9))

待添加的key,value----- [(3, 'F'), (1, 'G'), (8, 'H'), (9, 'A'), (7, 'C'), (2, 'D'), (5, 'B'), (4, 'E')]
将它们添加进字典中----- [ 3-->F, 1-->G, 8-->H, 2-->D, 7-->C, 9-->A, 5-->B, 4-->E, ]
用add方法对已存在的键相应的值进行更新，将7的值设为666----- [ 3-->F, 1-->G, 8-->H, 2-->D, 7-->666, 9-->A, 5-->B, 4-->E, ]
将键为7的键值对从字典中删除----- [ 3-->F, 1-->G, 8-->H, 2-->D, 5-->B, 9-->A, 4-->E, ]
将键为8的值设为"hahaha"----- [ 3-->F, 1-->G, 8-->hahaha, 2-->D, 5-->B, 9-->A, 4-->E, ]
获取键为8的相应的值----- hahaha
此时的size----- 7
最小的键为----- 1
将最小的键所在的键值对删除----- [ 3-->F, 2-->D, 8-->hahaha, 5-->B, 9-->A, 4-->E, ]
此时字典中是否包含键为9的键值对？----- True
