### 构建和维护最大堆

+ 堆：堆是一个数组，可以被看成一个近似的完全二叉树，树上的每一个节点对应数组的一个元素。除了最底层外，该树是完全充满的，而且是从左向右填充。表示对的数组$A$包括连个属性：$A.length$给出数组元素的个数，$A.heap-size$表示有多少个堆元素存储在该数组中。
+ 最大堆：某个结点的值至多与其父结点一样大。
+ 最小堆：某个结点的值至少与其父结点一样大。
+ 时间复杂度：$nlog_2n$
+ 排序是原址性的

In [10]:
class Heapify:
    def __init__(self, arr):
        self.arr = arr
        self.heapSize = len(arr)
    def parent(self, i):
        return i//2
    def right(self, i):
        return 2*i+1
    def left(self, i):
        return 2*i+2
    def max_heapify(self, i):
        l = self.left(i)
        r = self.right(i)
        largest = -1
        if l < self.heapSize and self.arr[l] > self.arr[i]:
            largest = l
        else:
            largest = i
        if r < self.heapSize and self.arr[r] > self.arr[largest]:
            largest = r
        if largest != i:
            self.arr[i], self.arr[largest] = self.arr[largest], self.arr[i]
            self.max_heapify(largest)
    def build_max_heap(self):
        for i in range(self.heapSize//2, -1, -1):
            self.max_heapify(i)

![构建最大堆](./image/buildheap.png)

In [11]:
test_arr = [4, 1, 3, 2, 16, 9, 10, 14, 8, 7]
heap = Heapify(test_arr)

In [12]:
heap.build_max_heap()
print(test_arr)

[16, 14, 10, 8, 7, 9, 3, 2, 4, 1]


### 堆排序

+ 堆排序思想：将数组建成最大堆，则数组中最大的元素就在根结点$A[1]$上，通过把它与$A[n]$进行交换，可以让该元素放到正确的位置。在剩余结点中，调用max_heapify(A, 0)，从而在$A[0..n-1]$上构造一个新的最大堆。排序算法不断重复这一过程，直到堆的大小降到2

In [58]:
class HeapSort:
    def __init__(self, arr):
        self.arr = arr
        self.heapSize = len(arr)
    def parent(self, i):
        return (i-1)//2
    def right(self, i):
        return 2*i+1
    def left(self, i):
        return 2*i+2
    def max_heapify(self, i):
        l = self.left(i)
        r = self.right(i)
        largest = -1
        if l < self.heapSize and self.arr[l] > self.arr[i]:
            largest = l
        else:
            largest = i
        if r < self.heapSize and self.arr[r] > self.arr[largest]:
            largest = r
        if largest != i:
            self.arr[i], self.arr[largest] = self.arr[largest], self.arr[i]
            self.max_heapify(largest)
    def build_max_heap(self):
        for i in range(self.heapSize//2, -1, -1):
            self.max_heapify(i)
    def sort(self):
        self.build_max_heap()
        for i in range(len(self.arr)-1,0,-1):
            self.arr[0], self.arr[i] = self.arr[i], self.arr[0]
            self.heapSize -= 1
            self.max_heapify(0)

In [18]:
test_arr_sort = [4, 1, 3, 2, 16, 9, 10, 14, 8, 7]
heapSort = HeapSort(test_arr_sort)
heapSort.sort()
print(test_arr_sort)

[1, 2, 3, 4, 7, 8, 9, 10, 14, 16]


### 优先队列

(1) 优先队列是一种用来维护由一组元素构成的集合S的数据结构，其中的每一个元素都有一个相关的值，称为关键字。一个最大优先队列支持一下操作：
+ $INSERT(S,x)$: 把元素$x$插入到集合$S$中。
+ $MAXIMUM(S)$: 返回$S$中具有最大关键字的元素。
+ $EXTRACT-MAX(S)$: 去掉并返回$S$中的具有最大关键字的元素。
+ $INCREASE-KEY(S, x, k)$: 将元素$x$的关键字值增加到$k$，这里假设$k$的值不小于$x$的原关键字值。

(2) 最大优先队列可用于共享计算机系统的作业调度。最大优先队列记录将要执行的各个作业以及他们之间的相对优先级。当一个作业完成或者被中断后，调度器调用EXTRACT-MAX从所有的等待作业中，选出具有最高优先级的作业来执行。在任何时候，调度器可以调用INSERT把一个新作业加入到队列中来。

(3) 最小优先队列可以被用于基于事件驱动的模拟器

In [61]:
class PriorityQueue:
    def __init__(self, heap):
        self.heap = heap
        heap.build_max_heap()
        self.arr = heap.arr
        self.heapSize = len(heap.arr)
    def heapMaximum(self):
        return self.arr[0]
    def heapExtractMax(self):
        if self.heapSize < 0:
            raise Exception("heap underflow")
        maxValue = self.arr[0]
        self.arr[0] = self.arr[self.heapSize-1]
        del self.arr[self.heapSize-1]
        self.heap.heapSize -= 1
        self.heapSize -= 1
        self.heap.max_heapify(0)
        return maxValue
    def heapIncreaseKey(self, i, key):
        if key < self.arr[i]:
            raise Exception("new key is smaller than current key")
        self.arr[i] = key
        while i > 0 and self.arr[self.heap.parent(i)] < self.arr[i]:
            self.arr[i], self.arr[self.heap.parent(i)] = self.arr[self.heap.parent(i)], self.arr[i]
            i = self.heap.parent(i)
    def maxHeapInsert(self, key):
        self.arr = self.arr + [float('-inf')]
        self.heapIncreaseKey(self.heapSize, key)
        self.heapSize += 1

In [62]:
test_arr_queue = [4, 1, 3, 2, 16, 9, 10, 14, 8, 7]
heapSort = HeapSort(test_arr_queue)
queue = PriorityQueue(heapSort)

In [63]:
queue.arr

[16, 14, 10, 8, 7, 9, 3, 2, 4, 1]

In [64]:
# 获取最大值
queue.heapMaximum()

16

In [65]:
# 获取最大值并删除
queue.heapExtractMax()

16

In [66]:
queue.arr

[14, 8, 10, 4, 7, 9, 3, 2, 1]

In [67]:
# 将索引7处的值改为7
queue.heapIncreaseKey(7,7)

In [68]:
queue.arr

[14, 8, 10, 7, 7, 9, 3, 4, 1]

In [69]:
# 插入6
queue.maxHeapInsert(6)

In [70]:
queue.arr

[14, 8, 10, 7, 7, 9, 3, 4, 1, 6]

In [71]:
queue.heapSize

10

In [72]:
# 插入19
queue.maxHeapInsert(19)

In [73]:
queue.arr

[19, 14, 10, 7, 8, 9, 3, 4, 1, 6, 7]

In [74]:
queue.heapSize

11