# Python数据结构与算法

## 四、树和树的算法

### 1. 树的列表表示

对于如下一棵树：

<img src = "image/4_1.jpg", width = 200, higth = 150>

表示如下：

In [1]:
myTree = ['a',['b',['d',[],[]],['e',[],[]]],['c',['f',[],[]],[]]]
print(myTree)
print('left subtree = ', myTree[1])  # 左子树
print('root = ', myTree[0])
print('right subtree = ', myTree[2]) # 右子树

['a', ['b', ['d', [], []], ['e', [], []]], ['c', ['f', [], []], []]]
left subtree =  ['b', ['d', [], []], ['e', [], []]]
root =  a
right subtree =  ['c', ['f', [], []], []]


### 2. 树的节点表示

In [2]:
# 定义一个二叉树类：
class BinaryTree:
#     初始化，设置根节点，子节点为空
    def __init__(self,rootObj):
        self.key = rootObj
        self.leftChild = None
        self.rightChild = None
#         插入左子树。若原子树为空，直接插入；若不为空，将原左子树放入现子树的下一层
    def insertLeft(self,newNode):
        if self.leftChild == None:
            self.leftChild = BinaryTree(newNode)
        else:
            t = BinaryTree(newNode)
            t.leftChild = self.leftChild
            self.leftChild = t
#             插入右子树
    def insertRight(self,newNode):
        if self.rightChild == None:
            self.rightChild = BinaryTree(newNode)
        else:
            t = BinaryTree(newNode)
            t.rightChild = self.rightChild
            self.rightChild = t
#             获取根节点和子节点
    def getRightChild(self):
        return self.rightChild
    def getLeftChild(self):
        return self.leftChild
    def setRootVal(self,obj):
        self.key = obj
    def getRootVal(self):
        return self.key
r = BinaryTree('a')
print(r.getRootVal())
print(r.getLeftChild())
r.insertLeft('b')
print(r.getLeftChild())
print(r.getLeftChild().getRootVal())
r.insertRight('c')
print(r.getRightChild())
print(r.getRightChild().getRootVal())
r.getRightChild().setRootVal('hello')
print(r.getRightChild().getRootVal())

a
None
<__main__.BinaryTree object at 0x00000241A60CF128>
b
<__main__.BinaryTree object at 0x00000241A60CF278>
c
hello


### 3. 树的遍历

（1）前序： 在前序遍历中，我们首先访问根节点，然后递归地做左侧子树的前序遍历，随后是右侧。 
（2）中序： 在一个中序遍历中，我们递归地对左子树进行一次遍历，访问根节点，最后递归遍历右子树。 
（3）后序： 在后序遍历中，我们递归地对左子树和右子树进行后序遍历，然后访问根节点。

前序遍历的递归写法

In [None]:
def preorder(tree):
    if tree:
        print(tree.getRootVal())
        preorder(tree.getLeftChild())
        preorder(tree.getRightChild())

后序遍历的递归写法

In [None]:
def postorder(tree):
    if tree != None:
        postorder(tree.getLeftChild())
        postorder(tree.getRightChild())
        print(tree.getRootVal())

中序遍历的递归写法

In [None]:
def inorder(tree):
    if tree != None:
        inorder(tree.getLeftChild())
        print(tree.getRootVal())
        inorder(tree.getRightChild())

### 4. 二叉堆实现

前面讲到了用排序函数和列表实现优先级队列。然而，插入列表是 O(n)并且排序列表是 O(nlogn)。

我们可以做得更好。实现优先级队列的经典方法是使用称为二叉堆的数据结构。二叉堆将允许我们在 O(logn) 中排队和取出队列。

In [16]:
# 二叉堆调用实例
from pythonds.trees.binheap import BinHeap
bh = BinHeap()
bh.insert(5)  # 插入元素
bh.insert(7)
bh.insert(3)
bh.insert(11)

print(bh.delMin())  # 返回具有最小键值的项，从堆中删除该项
print(bh.delMin())
print(bh.delMin())
print(bh.delMin())


3
5
7
11


In [19]:
# 实现
class BinHeap:
#     初始化
    def __init__(self):
        self.heapList = [0]  # 一个空的二叉堆有一个单一的零作为 heapList 的第一个元素
        self.currentSize = 0
        
    def percUp(self,i):   # 若新加入的项比之前的项小，依次与上层节点比较并置换
        while i // 2 > 0:
            if self.heapList[i] < self.heapList[i // 2]:
                tmp = self.heapList[i // 2]
                self.heapList[i // 2] = self.heapList[i]
                self.heapList[i] = tmp
            i = i // 2
            
#         插入项
    def insert(self,k):
        self.heapList.append(k)
        self.currentSize = self.currentSize + 1
        self.percUp(self.currentSize)
        
#  从根节点开始，依次与子节点比较，将父节点与较小的子节点置换
    def percDown(self,i):
        while (i * 2) <= self.currentSize:
            mc = self.minChild(i)
            if self.heapList[i] > self.heapList[mc]:
                tmp = self.heapList[i]
                self.heapList[i] = self.heapList[mc]
                self.heapList[mc] = tmp
            i = mc
                
#      寻找该节点下的最小子节点
    def minChild(self,i):
        if i * 2 + 1 > self.currentSize:
            return i * 2
        else:
            if self.heapList[i*2] < self.heapList[i*2+1]:
                return i * 2
            else:
                return i * 2 + 1
            
 #         删除最小项
    def delMin(self):
        retval = self.heapList[1]
        self.heapList[1] = self.heapList[self.currentSize]    # 先将最后一项补到根节点
        self.currentSize = self.currentSize - 1
        self.heapList.pop()
        self.percDown(1)            # 从根节点开始置换
        return retval
    
    def buildHeap(self,alist):
        i = len(alist) // 2
        self.currentSize = len(alist)
        self.heapList = [0] + alist[:]
        while (i > 0):
            self.percDown(i)   # 构建二叉堆
            i = i - 1
bh = BinHeap()
bh.buildHeap([9,5,6,2,3])
print(bh.delMin())
print(bh.delMin())
print(bh.delMin())
print(bh.delMin())
print(bh.delMin())

2
3
5
6
9


注意：构建二叉堆时，最先想到的操作是给定一个列表，通过一次插入一个键轻松地构建一个堆。但要在堆中插入 n 个键，将需要总共 O(nlogn) 操作。 

因此采用如上方式构建，我们可以在 O(n) 操作中构建整个堆。

（1）从中间层开始，将大的值移至下层。

（2）每次迭代向上一层，调用percDown函数，均逐渐将大的值移至下层。

示例如下：
<img src = "image/4_2.jpg", width = 500, higth = 200>

### 4. 二叉搜索树

搜索树特性：左子树中的所有键小于根中的键。 右子树中的所有键都大于根。

（1）插入节点：

①从树的根开始，搜索二叉树，将新键与当前节点中的键进行比较。如果新键小于当前节点，则搜索左子树。如果新键大于当前节点，则搜索右子树。

②当没有左（或右） 孩子要搜索时，我们在树中找到应该建立新节点的位置。

（2）查找节点：

递归地搜索树，直到它到达不匹配的叶节点或找到匹配的键。当找到匹配的键时，返回存储在节点的有效载荷中的值。

（3）删除节点：

①如果当前节点没有子节点，我们需要做的是删除节点并删除对父节点中该节点的引用。 

②如果当前节点只有一个子节点，只需把该节点删除，把子节点提上来，更新该节点子节点与父节点之间的引用。

③如果当前节点有两个子节点，选用右子树中的最小的键来替换该节点。并且易知，最小的键一定满足前两种情况，因此删除最小的键后用前两种方法补齐。

下面三张图分别表示了三种删除节点的操作：
<img src = "image/4_3.jpg", width = 500, higth = 200>
<img src = "image/4_4.jpg", width = 500, higth = 200>
<img src = "image/4_5.jpg", width = 500, higth = 200>

### 5. 平衡二叉搜索树

我们将节点的平衡因子定义为左子树的高度和右子树的高度之间的差。

如果平衡因子是 -1,0 或 1，我们将定义树平衡。

一旦添加新叶，我们必须更新其父的平衡因子。如果新节点是右子节点，则父节点的平衡因子将减少1。如果新节点是左子节点，则父节点的平衡因子将增加1。

实现流程：定义updateBalance 方法，首先检查当前节点是否不够平衡，需要重新平衡。如果平衡，则重新平衡完成，并且不需要对父节点进行进一步更新。如果当前节点不需要重新平衡，则调整父节点的平衡因子。如果父的平衡因子不为零，那么算法通过递归调用父对象上的 updateBalance ，继续沿树向根向上运行。（一旦一个子树的平衡因子为零，那么它的祖先节点的平衡不会改变。）

平衡方法：以右旋转为例。
<img src = "image/4_6.jpg", width = 500, higth = 200>

（1）提升左子节点（C） 为子树的根。

（2）将旧根（E） 移动为新根的右子树。

（3）如果新根（C） 已经有一个正确的右孩子（D） ，那么使它成为新的右孩子（E） 的左孩子。

但是有一种情况会出现问题，如下所示：
<img src = "image/4_7.jpg", width = 500, higth = 200>

只按上面的方法，不能实现平衡。要纠正这个问题，我们必须使用以下规则集：

（1）如果子树需要左旋转使其平衡，首先检查右子节点的平衡因子。 如果右孩子是重的，那么对右孩子做右旋转，然后是原来的左旋转。

（2）如果子树需要右旋转使其平衡，首先检查左子节点的平衡因子。 如果左孩子是重的，那么对左孩子做左旋转，然后是原来的右旋转。

In [None]:
def _put(self,key,val,currentNode):
    if key < currentNode.key:
        if currentNode.hasLeftChild():
            self._put(key,val,currentNode.leftChild)
        else:
            currentNode.leftChild = TreeNode(key,val,parent=currentNode)
            self.updateBalance(currentNode.leftChild)
    else:
        if currentNode.hasRightChild():
            self._put(key,val,currentNode.rightChild)
        else:
            currentNode.rightChild = TreeNode(key,val,parent=currentNode)
            self.updateBalance(currentNode.rightChild)
def updateBalance(self,node):
    if node.balanceFactor > 1 or node.balanceFactor < -1:
        self.rebalance(node)
        return
    if node.parent != None:
        if node.isLeftChild():
            node.parent.balanceFactor += 1
        elif node.isRightChild():
            node.parent.balanceFactor -= 1
        if node.parent.balanceFactor != 0:
            self.updateBalance(node.parent)
            
def rotateLeft(self,rotRoot):
    newRoot = rotRoot.rightChild
    rotRoot.rightChild = newRoot.leftChild
    if newRoot.leftChild != None:
        newRoot.leftChild.parent = rotRoot
    newRoot.parent = rotRoot.parent
    if rotRoot.isRoot():
        self.root = newRoot
    else:
        if rotRoot.isLeftChild():
            rotRoot.parent.leftChild = newRoot
        else:
            rotRoot.parent.rightChild = newRoot
    newRoot.leftChild = rotRoot
    rotRoot.parent = newRoot
    rotRoot.balanceFactor = rotRoot.balanceFactor + 1 - min(newRoot.balanceFactor, 0)   # 平衡因子更新公式，证明不再给出
    newRoot.balanceFactor = newRoot.balanceFactor + 1 + max(rotRoot.balanceFactor, 0)   

def rebalance(self,node):
    if node.balanceFactor < 0:
        if node.rightChild.balanceFactor > 0:
            self.rotateRight(node.rightChild)
            self.rotateLeft(node)
        else:
            self.rotateLeft(node)
    elif node.balanceFactor > 0:
        if node.leftChild.balanceFactor < 0:
            self.rotateLeft(node.leftChild)
            self.rotateRight(node)
        else:
            self.rotateRight(node)