# 3. 堆（Heap）

## 1. 定义
堆实际上是优先级队列的一种实现。

优先级队列从头部移除元素，元素的逻辑顺序是由优先级决定的。优先级最高的元素排在前面，优先级最低的元素排在后面。利用列表和排序函数是可以实现优先级队列的，但列表的插入速度是 $O(n)$，排序操作是 $O(n\log n)$。通过二叉堆实现优先级队列，可以将入队和出队的时间复杂度达到 $O(\log n)$。

所以如果需要维护一个有序列表，首先想到的就应该是二叉堆。根据有序是升序还是降序可以将二叉堆分为最小堆和最大堆。

二叉堆的结构类似于二叉树，同样由节点和边组成，每个父节点最多具有两个子节点，唯一不同的地方在于二叉堆具有有序性。最小的有序性体现在，父节点的值不会大于它的子节点的值。

为了保证二叉堆的对数性能，就要保持它的平衡，即其根节点左右子树节点的数量大致相等。通过完全二叉树即可实现树的平衡，完全二叉树除了最底层，其他每一层的节点都是满的，在最底层中，从左往右依次填充节点。

完全二叉树无需使用“节点与引用”的表示方法。由于树是完全的，可以通过一个列表表示出来。对于在列表中处于位置 p 的节点来说，它的左子节点正好处于位置 2p；同理，右子节点处于位置 2p+1。若要找到树中任意节点的父节点，只需使用 Python 的整数除法即可。给定列表中位置 n 处的节点，其父节点的位置就是 $n//2$。python 中索引从 0 开始，因此第一个元素可以留空。

最小堆的插入过程中需要保证其结构性质。元素加入列表最简单的方法就是将元素追加到列表的末尾，然后通过比较新元素和其父元素的大小，如果新元素小于其父元素，就将两者交换。最小堆的取出过程也类似，取出的是列表最左边的元素，然后将最后一个元素移动到最左边也就是根节点的位置。第二步，将新的根节点沿着树推到正确的位置，以重获堆的有序性，每一步父元素和两个子元素中较小的进行比较。

如果已有一个列表，将其转为最小堆，如果依次插入时间复杂度会是 $O(n\log n)$，但实际上在原有列表上移动元素可以达到 $O(n)$。要点在于叶子结点的元素无需判断，只要依次判断和移动节点即可，二叉树的节点一定在列表的前 $n / 2$ 个元素中，总的判断元素是 $n / 2$ 个，每次移动的次数不足 $\log n$ （树的高度），综合时间复杂度为 $O(n)$。 



In [13]:
class BinaryHeap():
    def __init__(self):
        self.heapList = [None]
        self.currentSize = 0

    def insert(self, newNum):
        self.heapList.append(newNum)
        self.currentSize += 1
        k = self.currentSize
        while k // 2 > 0:
            if self.heapList[k // 2] > self.heapList[k]:
                tmp = self.heapList[k // 2]
                self.heapList[k // 2] = self.heapList[k]
                self.heapList[k] = tmp
            k = k // 2
    
    def pop(self):
        retval = self.heapList[1]
        self.heapList[1] = self.heapList.pop()
        self.currentSize -= 1
        k = 1
        while k * 2 <= self.currentSize:
            if k * 2 + 1 <= self.currentSize and self.heapList[k * 2 + 1] < self.heapList[k * 2]:
                min_idx = k * 2 + 1
            else:
                min_idx = k * 2

            if self.heapList[min_idx] < self.heapList[k]:
                tmp = self.heapList[min_idx]
                self.heapList[min_idx] = self.heapList[k]
                self.heapList[k] = tmp
            
            k = min_idx
        return retval
    
    def heapify(self, lis):
        i = len(lis) // 2
        self.currentSize = len(lis)
        self.heapList = [None] +  lis
        while i > 0:
            k = i
            while k * 2 <= self.currentSize:
                if k * 2 + 1 <= self.currentSize and self.heapList[k * 2 + 1] < self.heapList[k * 2]:
                    min_idx = k * 2 + 1
                else:
                    min_idx = k * 2

                if self.heapList[min_idx] < self.heapList[k]:
                    tmp = self.heapList[min_idx]
                    self.heapList[min_idx] = self.heapList[k]
                    self.heapList[k] = tmp
                
                k = min_idx     
            i -= 1

lis = [2,4,5,3,4,1,7,9]
h = BinaryHeap()
h.heapify(lis)
print(h.heapList)
h.pop()
print(h.heapList)
h.insert(1)
print(h.heapList)

        

[None, 1, 3, 2, 4, 4, 5, 7, 9]
[None, 2, 3, 5, 4, 4, 9, 7]
[None, 1, 2, 5, 3, 4, 9, 7, 4]



### 155. 最小栈
设计一个支持 push ，pop ，top 操作，并能在常数时间内检索到最小元素的栈。

实现 MinStack 类:

MinStack() 初始化堆栈对象。
void push(int val) 将元素val推入堆栈。
void pop() 删除堆栈顶部的元素。
int top() 获取堆栈顶部的元素。
int getMin() 获取堆栈中的最小元素。
 

示例 1:

输入：
["MinStack","push","push","push","getMin","pop","top","getMin"]
[[],[-2],[0],[-3],[],[],[],[]]

输出：
[null,null,null,null,-3,null,0,-2]

解释：
MinStack minStack = new MinStack();
minStack.push(-2);
minStack.push(0);
minStack.push(-3);
minStack.getMin();   --> 返回 -3.
minStack.pop();
minStack.top();      --> 返回 0.
minStack.getMin();   --> 返回 -2.
 

提示：

-231 <= val <= 231 - 1
pop、top 和 getMin 操作总是在 非空栈 上调用
push, pop, top, and getMin最多被调用 3 * 104 次
