### 第六章 二叉树和树

树形结构：
- 树根root，唯一的其实结点
- 其余结点都只有一个前驱

#### 6.1 二叉树：概念和性质

二叉树：树中每个结点最多关联到两个后继结点。

分为左关联结点，  右关联结点。

6.1.1 概念和性质

二叉树是一种递归结构

基本概念：
- 空树
- 单点树
- 父结点
- 子结点
- 子孙结点
- 树叶结点：两颗子树均空，没有子结点。
- 度数：一个结点的子结点个数


满二叉树，扩充二叉树

- 满二叉树：所有分支结点的度数都为2
- 扩充二叉树：加入足够多的新叶结点，是原有树的结点变为度数为2. 新增的结点叫做外部结点。

完全二叉树：从0层到h-1层的结点都满。如果下一层的结点不满，且所有结点在最左边连续排列。

6.1.2 抽象数据类型


ADT BinTree:
    BinTree(self,data,left,right) #构造操作，创建一个新二叉树
    is_empty(self)
    num_nodes(self)#求二叉树的结点个数
    data(self)#获取二叉树根存储的数据
    left(self)#获取左子树
    right(self)#获取右子树
    set_left(self,btree)#用btree取代原来的左子树
    set_right(self,btree)#用btree取代原来的右子树
    traversal(self) #遍历二叉树中各结点数据的迭代器
    forall(self,op)#对二叉树的每个结点的数据执行操作op
    

遍历
- 深度优先遍历：顺着一条路
  - 先根序遍历（DLR）:得到先根序列
  - 中根序遍历（LDR）
  - 后根序遍历（LRD）
  
- 宽度优先遍历：按层次顺序遍历，得到层次序列


#### 6.2 二叉树的list实现

设计：
- 空树用None表示
- 非空二叉树用包含三个元素的表[d,l,r]表示
- d表示存在根结点的元素
- l和r是两颗子树，采用与整个二叉树同样结构的list表示。


In [8]:
def BinTree(data,left=None,right=None):
    return [data,left,right]

def is_empty_BinTree(btree):
    return btree is none

def root(btree):
    return btree[0]

def left(btree):
    return btree[1]

def right(btree):
    return btree[1]

def set_root(btree,data):
    btree[0] = data
    
def set_left(btree,data):
    btree[1] = left
    
def set_right(btree,right):
    btree[2] = right

In [10]:
#构造一个二叉树
t1 = BinTree(2,BinTree(4),BinTree(8))

In [11]:
t1

[2, [4, None, None], [8, None, None]]

In [14]:
set_left(left(t1),BinTree(5))

In [15]:
t1

[2, [4, <function __main__.left(btree)>, None], [8, None, None]]

6.2.2 二叉树的简单应用：表达式树

##### 6.3 优先队列

概述：存入其中的每项数据都另外附有一个数值，表示优先度。



#### 6.3.2基于线性表的实现

In [9]:
class PrioQueueError(ValueError):
    pass
class PrioQue:
    def __init__(self,elist=[]):#用可变对象作为默认值是一个危险行为
        self._elems = list(elist)
        self._elems.sort(reverse=True)
    
    def enqueue(self,e):
        i = len(self._elems) - 1  # 从最后一个元素往前比较
        while i >= 0 :
            if self._elems[i] <= e:
                i -= 1
            else:
                break
        self._elems.insert(i+1,e)  ###这个地方的逻辑，也就是下标。
        
    def is_empty(self):
        return not self._elems
    
    def peek(self):
        if self.is_empty():
            raise PrioQueueError('in top')
        return self._elems[-1]
    
    def dequeue(self):
        if self.is_empty():
            raise PrioQueueError('in pop')
        return self._elems.pop()

用线性表的缺点：检索和最终插入需要O(n)时间

6.3.3树形结构和堆

定义：堆就是结点里存储数据的完全二叉树
- 小顶堆：小元素在上
- 大顶堆：大元素在上

- 一个堆中，树根到任何一个叶结点的路径上，各结点的数据按规定的优先关系（非严格）递减。
- 最优先元素必定位于二叉树的堆顶。
- 位于树中不同路径上的元素，不关心顺序关系。

基于堆的优先队列类

In [19]:
class PrioQueue:
    
    def __init__(self,elist=[]):
        self._elems = list(elist)
        if elist:
            self.buildheap()
    def is_empty(self):
        return not self._elems
    
    def peek(self):
        if self.is_empty():
            raise PrioQueueError('in peek')
        return self._elems[0]
    
    def enqueue(self,e):
        self._elems.append(None)
        self.siftup(e,len(self._elems)-1)
        
    def siftup(self,e,last):  #向上筛选，当加入一个新元素，不断和父节点的元素比较，形成堆
        elems,i,j = self._elems,last,(last-1)//2
        while i > 0 and e < elems[j]:
            elems[i] = elems[j]
            i,j = j,(j-1)//2
        elems[i] = e
        
    def dequeue(self):
        if self.is_empty():
            raise PrioQueueError('in dequeue')
        elems = self._elems
        e0 = elems[0]
        e = elems.pop()
        if len(elems) > 0 :
            self.siftdown(e ,0 ,len(elems))
        return e0
    
    def siftdown(self,e,begin,end):
        elems,i,j = self._elems,begin,begin*2+1
        while j < end:
            if j + 1 < end and slems[j+1] < elems[j]:
                j += 1
            if e < elems[j]:
                break
            elems[i] = elems[j]
            i,j = j ,2*j + 1
        elems[i] = e
        
    def buildhea(self):
        end = len(self._elems)
        for i in range(end//2,-1,-1):
            self.siftdown(self._elems[i],i,end)

6.3.5 堆的应用： 堆排序
    

In [28]:
def heap_sort(elems):
    def siftdown(elems,e,begin,end):
        i,j = begin,begin * 2 + 1
        while j < end :
            if j + 1 < end and elems[j+1]<elems[j]:
                j += 1
            if e < elems[j]:
                break
            elems[i] = elems[j]
            i,j = j,2 *j +1
        elems[i] = e
        
    end = len(elems)
    
    for i in range(end//2,-1,-1):
        siftdown(elems,elems[i],i,end)
    
    for i in range((end-1),0 ,-1):
        e = elems[i]
        elems[i] = elems[0]
        siftdown(elems,e,0,i)
    return elems
        

In [29]:
a = [1,2,3,6,1,2,76]

In [30]:
print(heap_sort(a))

[76, 6, 3, 2, 2, 1, 1]
