# 堆
- 满足特定条件的完全二叉树（除了叶子节点外，其余每个节点都有两个子节点，且叶子节点靠左排布）
- 包含两类（小顶堆，大顶堆），一个是节点的值≤子节点的值，一个是节点的值≥子节点的值，根节点最小或者根节点最大
- 编程语言提供的是用优先队列priority queue，但是堆是用来实现优先队列的，所以以下将二者看作等价的
- 常见的操作：入堆push，堆顶出堆pop，访问堆顶元素peek，获取元素数量size，判断是否为空isEmpty

In [2]:
#0.初始化
min_heap = []
flag = 1
max_heap = []
flag = -1 #-1表示max，1表示min

#python的heapq模块默认实现的是小顶堆
#进一步初始化,入堆
import heapq
#变量写到函数里面，而不是先实例化一个变量（很奇怪）,即直接在原始变量中操作
#直接print其实看不出先后大小顺序
heapq.heappush(max_heap, flag * 1)
print(max_heap)
heapq.heappush(max_heap, flag * 3)
print(max_heap)
heapq.heappush(max_heap, flag * 2)
print(max_heap)
heapq.heappush(max_heap, flag * 5)
print(max_heap)
heapq.heappush(max_heap, flag * 4)
print(max_heap)

#获取堆顶元素，要么是max，要么是min
flag * max_heap[0]

#出堆
val = flag * heapq.heappop(max_heap) # 5
val = flag * heapq.heappop(max_heap) # 4
val = flag * heapq.heappop(max_heap) # 3
val = flag * heapq.heappop(max_heap) # 2
val = flag * heapq.heappop(max_heap) # 1

# 获取堆大小
size: int = len(max_heap)

# 判断堆是否为空
is_empty: bool = not max_heap

# 输入列表并建堆
min_heap = [1, 3, 2, 5, 4,-100,10000]
heapq.heapify(min_heap) 
print('peek',min_heap[0])

[-1]
[-3, -1]
[-3, -1, -2]
[-5, -3, -2, -1]
[-5, -4, -2, -1, -3]
peek -100


In [34]:
[100] + [1,2,3,4,5]

[100, 1, 2, 3, 4, 5]

In [26]:
#1.堆的实现
#用数组存储



class MaxHeap():
    def __init__(self,nums):
        self.max_heap = nums

    def left(self, i: int) -> int:
    """获取左子节点的索引"""
    return 2 * i + 1
    def right(self, i: int) -> int:
    """获取右子节点的索引"""
    return 2 * i + 2
    def parent(self, i: int) -> int:
    """获取父节点的索引"""
    return (i - 1) // 2  # 向下整除

    def size(self):
        return len(self.max_heap)
    def is_empty(self):
        return self.size() == 0
    #访问堆顶那个极值是简单的
    def peek(self):
        return self.max_heap[0]

    #入堆有难度,先添加到堆底，然后堆化修复
    def push(self, val: int):
        """元素入堆"""
        # 添加节点
        self.max_heap.append(val)
        # 从底至顶堆化
        self.sift_up(self.size() - 1)

    def sift_up(self, i: int):
        """从节点 i 开始，从底至顶堆化"""
        while True:
            # 获取节点 i 的父节点
            p = self.parent(i)
            # 当“越过根节点”或“节点无须修复”时，结束堆化
            if p < 0 or self.max_heap[i] <= self.max_heap[p]:
                break
            # 交换两节点
            self.swap(i, p)
            # 循环向上堆化
            i = p
    #出堆也有难度,直接去掉根节点会导致所有节点都需要修复，所有先将根节点和最右叶节点交换，然后从上到下堆化修复
    def pop(self) -> int:
    """元素出堆"""
    # 判空处理
    if self.is_empty():
        raise IndexError("堆为空")
    # 交换根节点与最右叶节点（交换首元素与尾元素）
    self.swap(0, self.size() - 1)
    # 删除节点
    val = self.max_heap.pop()
    # 从顶至底堆化
    self.sift_down(0)
    # 返回堆顶元素
    return val

    def sift_down(self, i: int):
        """从节点 i 开始，从顶至底堆化"""
        while True:
            # 判断节点 i, l, r 中值最大的节点，记为 ma
            l, r, ma = self.left(i), self.right(i), i
            if l < self.size() and self.max_heap[l] > self.max_heap[ma]:
                ma = l
            if r < self.size() and self.max_heap[r] > self.max_heap[ma]:
                ma = r
            # 若节点 i 最大或索引 l, r 越界，则无须继续堆化，跳出
            if ma == i:
                break
            # 交换两节点
            self.swap(i, ma)
            # 循环向下堆化
            i = ma

#要求输入的列表已经是一个合法的堆
#如果不是的话，init里面遍历调整顺序？这就是下一节的建堆操作
max_heap = MaxHeap([9,8,6,6,7,5,2,1,4,3])


## 堆的常见应用
- 优先队列：堆通常作为实现优先队列的首选数据结构，其入队和出队操作的时间复杂度均为 O（logn），而建队操作为O（n），这些操作都非常高效。
- 堆排序：给定一组数据，我们可以用它们建立一个堆，然后不断地执行元素出堆操作，从而得到有序数据。然而，我们通常会使用一种更优雅的方式实现堆排序，详见“堆排序”章节。
- 获取最大的k个元素：这是一个经典的算法问题，同时也是一种典型应用，例如选择热度前 10 的新闻作为微博热搜，选取销量前 10 的商品等。