In [1]:
class Heap(list):
    """继承 python 内置的 list 类型，并添加 heap_size 属性"""
    def __init__(self, array, heap_size=None):
        list.__init__(self, array)
        self.heap_size = len(array) if heap_size is None else heap_size

# 1. 堆 

- 堆是一个数组，可以被看成一个近似的完全二叉树（除了最底层，该树应该是完全充满的）
- 示意图
<img src=https://raw.githubusercontent.com/Lijunjie9502/PicBed/master/20191211201233.png width = 600>
- $A\left[ {1 \ldots A.length} \right]$ 中可能都含有元素，但只有 $A\left[ {1 \ldots A.heap\_size} \right]$ 中存放的是有效元素

### **获取给定节点的父节点，左孩子结点和右孩子结点** 


- 常用编程语言的下标从 0 开始，除了代码部分，则默认数组下标从 1 开始
- 可通过左移或右移操作来加快计算速度
- python 的移位操作优先级较低，注意加括号以避免出错

In [2]:
def parent(i):
    return (i-1) >> 1

def left(i):
    return (i << 1) + 1

def right(i):
    return (i << 1) + 2

In [3]:
i = 3
print("the parent of i is {}, the left child of i is {}, the right child of i is {}". format(parent(i), left(i), right(i)))

the parent of i is 1, the left child of i is 7, the right child of i is 8


### 最大堆与最小堆

- 最大堆的性质
    - 对于除了根节点以外的所有节点 $i$ 都要满足：$$A\left[ {PARENT\left( i \right)} \right] \ge A\left[ i \right]$$
    
    - 即最大堆中的最大元素存放在根节点中，且在任一子树中，这一性质也成立


- 最小堆的性质
    - 对于除了根节点以外的所有节点 $i$ 都要满足：$$A\left[ {PARENT\left( i \right)} \right] \le A\left[ i \right]$$
    
    - 即最小堆中的最小元素存放在根节点中，且在任一子树中，这一性质也成立

### 堆的应用

- 排序
- 优先队列

### 堆的性质

- 包含 $n$ 个元素的堆高度为 $\Theta(lg(n))$
- 堆结构上的一些基本操作至多与堆的高度成正比，即时间复杂度为 $O(lg(n))$
- 最大堆的最小元素位于叶节点中
- 已排好序的数组是一个最小堆
- 当用数组表示储存 $n$ 个元素的堆时，叶结点的下标分别为 $\left\lfloor {{n \over 2}} \right\rfloor  + 1,\left\lfloor {{n \over 2}} \right\rfloor  + 2, \cdots ,n$

# 2. 维护堆的性质

- 在调用 MAX-HEAPIFY 假设：
    - 根结点为 LEFT($i$) 和 RIGHT($i$) 的二叉树都是最大堆
    - $A[i]$ 可能小于其孩子节点

### 程序执行示意图

<img src="https://raw.githubusercontent.com/Lijunjie9502/PicBed/master/20191211201929.png" width = 800>

### 代码实现

In [4]:
def max_heapify(A, i):
    l = left(i)
    r = right(i)
    largest = i
    if l < A.heap_size and A[l] > A[largest]:
        largest = l
    if r < A.heap_size and A[r] > A[largest]:
        largest = r
    if largest != i:
        A[i], A[largest] = A[largest], A[i]
        max_heapify(A, largest)

In [5]:
A = Heap([16, 4, 10, 14, 7, 9, 3, 2, 8, 1])
max_heapify(A, 1)
print(A)

[16, 14, 10, 8, 7, 9, 3, 2, 4, 1]


###  复杂度分析

- 调用 $A[i], A[LEFT(i)], A[RIGHT(i)]$ 的时间代价为 $\Theta(1)$
- 子树的规模最大为 $ 2n/3 $
  - 发生在最底层恰好半满的时候
      - 设树高为 $h$，则除最底层个，包含的元素数为：
      $$1 + 2 + {2^2} +  \cdots  + {2^{h - 1}} = {{{2^h} - 1} \over {2 - 1}} = {2^h} - 1$$
      - 左右子树各占 $(2^h-1)/2 = 2^{h-1} - 1/2$
      - 最后一层半满时，元素数为 $2^{h-1}$
      - 最大子树的规模为：
      $${{{2^{h - 1}} + {{\rm{2}}^{h - 1}} - 1/2} \over {{2^{h - 1}} + {2^h} - 1}} \approx {2 \over 3}$$
- 运行时间的递推式为：$$T(n) \le T(2n/3) + \Theta(1)$$

由主定理可得，运行时间为 $O\left( {\lg n} \right)$，即 $O(h)$

##  练习

###  6.2-2 MINI-HEAPIFY

In [6]:
def mini_heapify(A, i):
    l = left(i)
    r = right(i)
    smallest = i
    if l < A.heap_size and A[l] < A[smallest]:
        smallest = l
    if r < A.heap_size and A[r] < A[smallest]:
        smallest = r
    if smallest != i:
        A[smallest], A[i] = A[i], A[smallest]
        mini_heapify(A, smallest)

In [7]:
A = Heap([1, 10, 3, 4, 5, 6, 7, 8, 9, 10])
mini_heapify(A, 1)
print(A)

[1, 4, 3, 8, 5, 6, 7, 10, 9, 10]


### 6.2-5 用循环控制结构重写 MAX-HEAPIFY

In [8]:
def max_heapify_loop(A, i):
    while True:
        l = left(i)
        r = right(i)
        largest = i
        if l < A.heap_size and A[l] > A[largest]:
            largest = l
        if r < A.heap_size and A[r] > A[largest]:
            largest = r
        if largest != i:
            A[i], A[largest] = A[largest], A[i]
            i = largest
        else:
            break

In [9]:
A = Heap([16, 4, 10, 14, 7, 9, 3, 2, 8, 1])
max_heapify_loop(A, 1)
print(A)

[16, 14, 10, 8, 7, 9, 3, 2, 4, 1]


# 3. 建堆

- 子数组 $A\left( {\left\lfloor {n/2} \right\rfloor  + 1 \ldots n} \right)$ 中的元素都是树的叶节点
- 每个叶节点都可以看成只包含一个元素的堆
- 因此， BUILD-MAX-HEAP 对树中的其他节点都调用一次 MAX-HEAPIFY 即可

###  示意图

<img src="https://raw.githubusercontent.com/Lijunjie9502/PicBed/master/20191211211919.png" width=800>

###  代码实现

In [10]:
def build_max_heap(A):
    A.heap_size = len(A)
    for i in reversed(range(len(A)//2)):
        max_heapify(A, i)

In [11]:
A = Heap([4, 1, 3, 2, 16, 9, 10, 14, 8, 7])
build_max_heap(A)
print(A)

[16, 14, 10, 8, 7, 9, 3, 2, 4, 1]
