# 树的概念
节点：
节点是树的基础部分。它可以有自己的名字，我们称作“键”。节点也可以带有附加信息， 我们称作“有效载荷”。有效载荷信息对于很多树算法来说不是重点，但它常常在使用树的应用 中很重要。


边：
边是树的另一个基础部分。两个节点通过一条边相连，表示它们之间存在关系。除了根节点 以外，其他每个节点都仅有一条入边，出边则可能有多条。


根节点：
根节点是树中唯一没有入边的节点。在图 6-2 中，/就是根节点。


路径：
 路径是由边连接的有序节点列表。比如，哺乳纲→食肉目→猫科→猫属→家猫就是一条路径。
 

子节点：
一个节点通过出边与子节点相连。在图 6-2 中，log/、spool/和 yp/都是 var/的子节点。


父节点
一个节点是其所有子节点的父节点。在图 6-2 中，var/是 log/、spool/和 yp/的父节点。


兄弟节点：
具有同一父节点的节点互称为兄弟节点。文件系统树中的 etc/和 usr/就是兄弟节点。


子树：
一个父节点及其所有后代的节点和边构成一棵子树。


叶子节点：
叶子节点没有子节点。比如，图 6-1 中的人和黑猩猩都是叶子节点。


层数：
节点 n 的层数是从根节点到 n 的唯一路径长度。在图 6-1 中，猫属的层数是 5。由定义可知， 根节点的层数是 0。


高度：
树的高度是其中节点层数的最大值。图 6-2 中的树高度为 2。 定义基本术语后，就可以进一步给出树的正式定义。实际上，本书将提供两种定义，其中一
种涉及节点和边，另一种涉及递归。你在后面会看到，递归定义很有用。

In [1]:
class BinaryTree:
    def __init__(self, rootObj):
        self.key = rootObj
        self.leftChild = None
        self.rightChild = None
    
# 插入左子节点
# 在插入左子树时，必须考虑两种情况。第一种情况是原本没有左子节点。此时，只需往树中 添加一个节点即可。
# 第二种情况是已经存在左子节点。此时，插入一个节点，并将已有的左子节 点降一层。
    def insertLeft(self, newNode):
        if self.leftChild == None:
            self.leftChild = BinaryTree(newNode)
        else:
            t = BinaryTree(newNode)
            t.leftChild = self.leftChild
            self.leftChild = t
            
# 插入右子节点
    def insertRight(self, newNode):
        if self.rightChild == None:
            self.rightChild = BinaryTree(newNode)
        else:
            t = BinaryTree(newNode)
            t.right = self.rightChild
            self.rightChild = t

# 二叉树的访问函数
    def getRightChild(self):
        return self.rightChild

    def getLeftChild(self):
        return self.leftChild

    def setRootVal(self, obj):
        self.key = obj

    def getRootVal(self):
        return self.key

In [2]:
# 调用二叉树 设立一个根节点
r = BinaryTree('a')
r.getRootVal()

'a'

In [8]:
# 现在是没有左子树的
print(r.getLeftChild())

None


In [3]:
# 插入左子树后再获取对应的值
r.insertLeft('b')
print(r.getLeftChild().getRootVal())

b


In [4]:
r.insertRight('c')
print(r.getRightChild().getRootVal())

c


In [12]:
r.getRightChild().setRootVal('hello')
print(r.getRightChild().getRootVal())

hello


In [7]:
# 前序遍历
def preorder(tree):
    if tree:
        print(tree.getRootVal())
        preorder(tree.getLeftChild())
        preorder(tree.getRightChild())
preorder(r)

a
b
c


In [10]:
# 后序遍历
def postorder(tree):
    if tree:
        preorder(tree.getLeftChild())
        preorder(tree.getRightChild())
        print(tree.getRootVal())
preorder(r)

c
b
a


# 二叉树的应用

## 解析树
使用解析树实现计算，规则如下：

(1) 如果当前标记是(，就为当前节点添加一个左子节点，并下沉至该子节点;

(2) 如果当前标记在列表['+', '-', '/', '*']中，就将当前节点的值设为当前标记对应 的运算符;为当前节点添加一个右子节点，并下沉至该子节点;

(3) 如果当前标记是数字，就将当前节点的值设为这个数并返回至父节点;

(4) 如果当前标记是)，就跳到当前节点的父节点。

In [25]:
# 计算(3 + (4 * 5))
# (a) 创建一棵空树。
# (b) 读入第一个标记(。根据规则 1，为根节点添加一个左子节点。
# (c) 读入下一个标记 3。根据规则 3，将当前节点的值设为 3，并回到父节点。
# (d) 读入下一个标记+。根据规则 2，将当前节点的值设为+，并添加一个右子节点。新节点 成为当前节点。
# (e) 读入下一个标记(。根据规则 1，为当前节点添加一个左子节点，并将其作为当前节点。
# (f) 读入下一个标记 4。根据规则 3，将当前节点的值设为 4，并回到父节点。
# (g) 读入下一个标记*。根据规则 2，将当前节点的值设为*，并添加一个右子节点。新节点 成为当前节点。
# (h) 读入下一个标记 5。根据规则 3，将当前节点的值设为 5，并回到父节点。
# (i) 读入下一个标记)。根据规则 4，将*的父节点作为当前节点。
# (j) 读入下一个标记)。根据规则 4，将+的父节点作为当前节点。因为+没有父节点，所以工作完成。

from pythonds.basic import Stack
from pythonds.trees import BinaryTree
import operator

def buildParseTree(fpexp):
    fplist = fpexp.split(' ')
    pStack = Stack()
    eTree = BinaryTree('')
    pStack.push(eTree)
    currentTree = eTree
    for i in fplist:
        if i == '(':
              currentTree.insertLeft('')
              pStack.push(currentTree)
              currentTree = currentTree.getLeftChild()
        elif i not in '+-*/)':
              currentTree.setRootVal(eval(i))
              parent = pStack.pop()
              currentTree = parent
        elif i in '+-*/':
              currentTree.setRootVal(i)
              currentTree.insertRight('')
              pStack.push(currentTree)
              currentTree = currentTree.getRightChild()
        elif i == ')':
              currentTree = pStack.pop()
        else:
              raise ValueError("Unknown Operator: " + i)
    return eTree


    
def evaluate(parseTree):
    opers = {'+':operator.add, '-':operator.sub,
             '*':operator.mul, '/':operator.truediv}
    leftC = parseTree.getLeftChild()
    rightC = parseTree.getRightChild()
    if leftC and rightC:
        fn = opers[parseTree.getRootVal()]
        return fn(evaluate(leftC), evaluate(rightC))
    else:
        return parseTree.getRootVal()


def postordereval(tree):
    opers = {'+':operator.add, '-':operator.sub,
             '*':operator.mul, '/':operator.truediv}
    res1 = None
    res2 = None
    if tree:
            res1 = postordereval(tree.getLeftChild())
            res2 = postordereval(tree.getRightChild())
            if res1 and res2:
                  return opers[tree.getRootVal()](res1, res2)
            else: 
                  return tree.getRootVal()

def printexp(tree):
      sVal = ""
      if tree:
            if tree.getLeftChild():
                  sVal = '(' + printexp(tree.getLeftChild())
            else:
                  printexp(tree.getLeftChild())                 
            sVal = sVal + str(tree.getRootVal())
            if tree.getRightChild():
                  sVal = sVal + printexp(tree.getRightChild()) + ')'
            else:
                  sVal + printexp(tree.getRightChild())
      return sVal

In [26]:
etree  = buildParseTree('( 3 + ( 4 * 5 ) )')
postordereval(etree)
printexp(etree)

'(3+(4*5))'

# 利用二叉堆实现优先级队列


## 二叉堆的实现
通过创建一棵完全二叉树来维持树的平衡。在完全二叉树中，除了最底层，其他每一层的节点都是满的。在最底层，我们从左往右填充节点。

完全二叉树的另一个有趣之处在于，可以用一个列表来表示它，而不需要采用“列表之列表” 或“节点与引用”表示法。由于树是完全的，**因此对于在列表中处于位置 p 的节点来说，它的左子 节点正好处于位置 2p;同理，右子节点处于位置 2p+1**。若要找到树中任意节点的父节点，只需使 用 Python 的整数除法即可。**给定列表中位置 n 处的节点，其父节点的位置就是 n/2**。

In [None]:
class BinaryHeap():
    # 新建二叉堆
    def __init__(self):
        self.heapList = [0]
        self.currentSize = 0

    # 新元素上移
    def percUp(self, i): 
        while i//2>0:
            if self.heapList[i] < self.heapList[i // 2]: # 如果子节点你小于父节点则交换位置（上移）
                self.heapList[i],self.heapList[i // 2] = self.heapList[i // 2],self.heapList[i]
            i = i // 2 
    
    # 插入新元素
    def insert(self, k):
        self.heapList.append(k)
        self.currentSize = self.currentSize + 1
        self.percUp(self.currentSize)
        
    def percDown(self, i):
        while (i * 2) <= self.currentSize: # 代表是有叶节点的
            mc = self.minChild(i) # 最小叶节点
            if self.heapList[i] > self.heapList[mc]:
                self.heapList[mc],self.heapList[i] = self.heapList[i],self.heapList[mc]
            i = mc

    def minChild(self, i):
        if i * 2 + 1 > self.currentSize: # 如果只有一个叶节点，那就return唯一一个
                return i * 2
        else: # 否则就判断哪个比较小
            if self.heapList[i*2] < self.heapList[i*2+1]:
                return i * 2
            else:
                return i * 2 + 1

    # 二叉堆中删除最小的元素
    def delMin(self):
        retval = self.heapList[1] # 根节点
        self.heapList[1] = self.heapList[self.currentSize]  
        self.currentSize = self.currentSize - 1
        self.heapList.pop() # 弹出最后一个叶节点
        self.percDown(1) # 一层层往下放
        return retval # return最小的数

    # 根据元素列表构建堆    
    def buildHeap(self, alist):
        i = len(alist) // 2
        self.currentSize = len(alist)
        self.heapList = [0] + alist[:]
        while (i > 0):
            self.percDown(i) 
            i = i - 1 

## 二叉搜索树

在实现搜索树之前，我们来复习一下映射抽象数据类型提供的接口。你会发现，这个接口类
似于 Python 字典。

1.Map()新建一个空的映射。

2.put(key, val)往映射中加入一个新的键–值对。如果键已经存在，就用新值替换旧值。  get(key)返回 key 对应的值。如果 key 不存在，则返回 None。

3.del 通过 del map[key]这样的语句从映射中删除键–值对。

4.len()返回映射中存储的键–值对的数目。

5.in 通过 key in map 这样的语句，在键存在时返回 True，否则返回 False。


二叉搜索树依赖于这样一个性质:小于父节点的键都在左子树中，大于父节点的键则都在右子树中。我们称这个性质为二叉搜索性，它会引导我们实现上述映射接口。

我们将采用“节点与引用”表示法实现二叉搜索树，它类似于我们在实现链表和表达式树时 采用的方法。不过，由于必须创建并处理一棵空的二叉搜索树，因此我们将使用两个类。一个称作 BinarySearchTree，另一个称作 TreeNode。BinarySearchTree 类有一个引用，指向作为二叉搜索树根节点的 TreeNode 类。大多数情况下，外面这个类的方法只是检查树是否为空。 如果树中有节点，请求就被发往 BinarySearchTree 类的私有方法，这个方法以根节点作为参数。当树为空，或者想删除根节点的键时，需要采取特殊措施。

In [6]:
class BinarySearchTree:

    def __init__(self):
        self.root = None
        self.size = 0
    
    def length(self):
        return self.size
    
    def __len__(self):
        return self.size
    
    def __iter__(self):
        return self.root.__iter__()


# TreeNode 类提供了很多辅助函数，这大大地简化了 BinarySearchTree 类的工作
class TreeNode:
    def __init__(self,key, val, left=None, right=None,
                                         parent=None):
        self.key = key
        self.payload = val
        self.leftChild = left
        self.rightChild = right
        self.parent = parent

    def hasLeftChild(self):
        return self.leftChild

    def hasRightChild(self):
          return self.rightChild

    def isLeftChild(self):
        return self.parent and \
        self.parent.leftChild == self 

    def isRightChild(self):
        return self.parent and \
            self.parent.rightChild == self
    
    def isRoot(self):
        return not self.parent

    def isLeaf(self):
        return not (self.rightChild or self.leftChild)

    def hasAnyChildren(self):
        return self.rightChild or self.leftChild

    def hasBothChildren(self):
        return self.rightChild and self.leftChild

    def replaceNodeData(self, key, value, lc, rc):
        self.key = key
        self.payload = value
        self.leftChild = lc
        self.rightChild = rc

        if self.hasLeftChild():
            self.leftChild.parent = self

        if self.hasRightChild():
            self.rightChild.parent = self
    


    # put 是 BinarySearchTree 类的一个方法。它检查树是否已经有根节点，
    # 若没有，就创建一个 TreeNode，并将其作为树的根节点;
    # 若有，就调用私有的递归辅助函数_put，并根据 以下算法在树中搜索。
    # 1.从根节点开始搜索二叉树，比较新键与当前节点的键。如果新键更小，搜索左子树。如果新键更大，搜索右子树。
    # 2.当没有可供搜索的左(右)子节点时，就说明找到了新键的插入位置。
    # 3.向树中插入一个节点，做法是创建一个TreeNode 对象，并将其插入到前一步发现的位置上。
    def put(self, key, val):
        if self.root: # 有根节点就调用私有的递归辅助函数_put，并根据以下算法在树中搜索。
            self._put(key, val, self.root)
        else:  # 没有根节点，创建一个 TreeNode，并将其作为树的根节点;
            self.root = TreeNode(key, val)
        self.size = self.size + 1

    def _put(self, key, val, currentNode):
        if key < currentNode.key: # 如果新键更小，搜索左子树
            if currentNode.hasLeftChild():
                self._put(key, val, currentNode.leftChild)
            else:
                currentNode.leftChild = TreeNode(key, val,
                                    parent=currentNode)
        else:
            if currentNode.hasRightChild():
                self._put(key, val, currentNode.rightChild)
            else:
                currentNode.rightChild = TreeNode(key, val,
                                    parent=currentNode)



    # 定义 put 方法后，就可以方便地通过让__setitem__方法调用 put 方法来重载[]运算符。 
    # 如此一来，就可以写出像 myZipTree['Plymouth'] = 55446 这样的 Python 语句，
    # 就如同访问Python字典一样。
    def __setitem__(self, k, v):
        self.put(k, v)



    # _get 方法中的搜索代码和_put 方法中选择左右子节点的逻辑相同。
    # 注意，_get 方法返回一个TreeNode给 get。这样一来，对于其他 BinarySearchTree 方法来说，
    # 如果需要使用 TreeNode 有效载荷之外的数据，_get可以作为灵活的辅助函数使用。
    def get(self,key):
        if self.root:
            res = self._get(key,self.root)
            if res:
                return res.payload
            else:
                return None
        else:
            return None
    
    def _get(self,key,currentNode):
        if not currentNode:
            return None
        elif currentNode.key ==key:
            return currentNode
        
        elif key < currentNode.key:
            return self._get(key,currentNode.leftChild)
        else:
            return self._get(key,currentNode.rightChild)

    def __getitem__(self,key):
        return self.get(key)




    # 利用 get 方法，可以通过为 BinarySearchTree 编写__contains__方法来实现 in 操作。
    # __contains__方法只需调用 get 方法，并在 get 方法返回一个值时返回 True，或在get方法返回 None时返回 False。
    def __contains__(self, key):
        if self._get(key, self.root):
            return True
        else:
            return False



    # delete方法
    def delete(self, key):
        if self.size > 1:
            nodeToRemove = self._get(key, self.root)
            if nodeToRemove:  # 如果能够找到待删除的key
                self.remove(nodeToRemove)
                self.size = self.size - 1
            else:
                raise KeyError('Error, key not in tree')
        elif self.size == 1 and self.root.key == key:
            self.root = None
            self.size = self.size - 1
        else:
            raise KeyError('Error, key not in tree')

    def __delitem__(self, key):
        self.delete(key)

    
    # 找到key对应的节点后要考虑三种情况
    # 删除节点又0,1,2个子节点

    # case1 没有子节点
    if currentNode.isLeaf():
        if currentNode == currentNode.parent.leftChild:
            currentNode.parent.leftChild = None
        else:
            currentNode.parent.rightChild = None
    
    # case2 一个子节点
    # 1，如果当前节点是一个左(右)子节点，只需将当前节点的左(右)子节点对父节点的引用改为指向当 前节点的父节点，
    # 然后将父节点对当前节点的引用改为指向当前节点的左(右)子节点。
    # 2.如果当前节点没有父节点，那它肯定是根节点。调用replaceNodeData方法，
    # 替换根节点的 key、payload、leftChild 和 rightChild 数据。

    else: # 只有一个子节点
        if currentNode.hasLeftChild():
                if currentNode.isLeftChild():
                        currentNode.leftChild.parent = currentNode.parent
                        currentNode.parent.leftChild = currentNode.leftChild
                elif currentNode.isRightChild():
                        currentNode.leftChild.parent = currentNode.parent
                        currentNode.parent.rightChild = currentNode.leftChild
                else: currentNode.replaceNodeData(currentNode.leftChild.key,
                                                currentNode.leftChild.payload,
                                                currentNode.leftChild.leftChild,
                                                currentNode.leftChild.rightChild)
        else:
            if currentNode.isLeftChild():
                currentNode.rightChild.parent = currentNode.parent
                currentNode.parent.leftChild = currentNode.rightChild
            elif currentNode.isRightChild():
                currentNode.rightChild.parent = currentNode.parent
                currentNode.parent.rightChild = currentNode.rightChild
            else:
                currentNode.replaceNodeData(currentNode.rightChild.key, currentNode.rightChild.payload,
                                                    currentNode.rightChild.leftChild,
                                                    currentNode.rightChild.rightChild)         