# 知识点

## 定义
* 堆是完全二叉树或者近似二叉树，它的各个节点的键值都有固定对应的的数字
* 完全二叉树:root到最后一个node之间没有None,每一个节点上都是有值的；加入一个新值的时候, 如果是最小值，就放到堆顶，如果不是最小值，就放在最后一层，从左边开始往右放
* **Index**: 根节点（即root,最上面起始位置）是0，若父节点为heap[k]，则子节点为heap[2k+1]和heap[2k+2]。
* **最小堆**: 父节点对应的值总是小于或者等于子节点（也就是说，最小值在堆顶）
    * heapq模块是python的一个标准库，它实现了一个堆数据结构
    * 在heapq中，默认是最小堆
* **最大堆**: 父节点的值总是大于或者等于子节点，称为最大堆
    * 实现最大堆方法:
        * 生成：对每个数取负，加入heap (Y = -X)
        * 弹出top：对heappop()的数取负

## 常用操作

（增删查并改）


**引入模块**   
* from heapq import heapify, heappop, heappush, heappushpop, heapreplace, nlargest, nsmallest
* <span class="mark">from heapq import *</span>
* import heapq  # 使用模块的时候,heapq.XXX

**创建**   
* 初始化为空： heap = []
* 创建： <span class="mark">heapify(list)</span> 
    * 在原有list上直接修改，heap = heapify(heap)是错误的
    * tO(N),N is length of list

**增**   
* <span class="mark">heappush(heap, item)</span>
    * 把item添加到heap这个list中
    * item可以为tuple等，(x, y)的时候，按照x来排序
    * tO(logN),N是目前含有的元素的数量
    
**删**   
* <span class="mark">heappop(heap)</span>把堆顶元素弹出
    * 把堆顶元素弹出,次小值变成堆顶
    * tO(logN),
        * 不是O(1),因为删完之后还得再排序,把最小值放到堆顶
    
**替**
* 先加后删
    * <span class="mark">heappushpop(C, 2)</span> # 先添加，再删除顶端的 -> 保持顶端的elem永远是最小的
    * 要加入的值比原来堆顶小的时候, 加入进去之后马上被删掉了,还是原来的堆
* 先删后加
    * <span class="mark">heapreplace(C, 5)</span> # 先删除顶端的，再添加 -> 顶端的不一定是最小的
    
**查**   
* <span class="mark">list = nlargest(k, input - iterable, key=None)</span>
    * 返回input中前k个符合k条件的最大值
    * tO(nlogk), n is length of input
    * e.g.nlargest(k,dic,key = lambda x:dic[x]), 与sort的写法一致
* <span class="mark">list = nsmallest(k, input - iterable, key=None)</span>
    * 返回input中前k个最小值

**len**   
len(heap)

In [4]:
from heapq import * 
heap = [1,2,3,4,5]
heapify(heap)
heappop(heap)
len(heap)

4

## 题目总结

* python里面,sort list的话, 时间复杂度是O(NlogN)，所以可以用heap进行优化
* python里的sort函数，用的是快速排序和归并排序
* 快速排序，归并排序等的时间复杂度都是O(NlogN)

### 求第k个最大最小的数 kth smallest/biggest element

以求第k个最大值为例

**方法1**   
* 不是最优解
* Y = -X
* 建立heap
* heappop k次
* 再取负值
* T: O(N + klogN) k是第几大，N是元素个数


**方法2** 
* 最优解
* 用最小堆求最大kth值
* 用最大堆求最小kth值
* 以用最小堆找最大kth值为例:
    * 建立一个k大小的最小堆, heapify(arr[:k])
    * 加arr[k]到heap中，删掉最小值(**先加后删** heappushpop)
    * 重复上一步,直到arr里的值都被加入到heap (arr[k:])
    * pop出来的便是最后的答案
* T: O(Nlogk) k是第几大，N是元素个数

**方法3**
* nlargest(k, arr)[-1]


In [None]:
'''
直接sort
T: O(NlogN)
'''
class Solution:
    def findKthLargest(self, nums, k):
        nums.sort()
        return nums[-k]

In [None]:
'''
用heap方法1
T: O(N + klogN) k是第几大，N是元素个数
不是最优解
'''
from heapq import heapify, heappop
class Solution:
    def findKthLargest(self, nums, k):
        heap = [-x for x in nums]
        heapify(heap)
        for i in range(k):
            res = heappop(heap)
        return -res

    
from heapq import heappush, heappop
class Solution:
    def findKthLargest(self, nums, k):
        heap = []
        for i in nums:
            heappush(heap, -i)
        while k:
            res = heappop(heap)
            k -= 1
        return -res

In [None]:
'''
用heap方法2
T: O(Nlogk) k是第几大，N是元素个数
最优解
'''

from heapq import heapify, heappushpop, heappop
class Solution:
    def findKthLargest(self, nums, k):
        heap = nums[:k]
        heapify(heap)
        for i in nums[k:]:
            if heap[0] < i:  # 也可没有
                heappushpop(heap, i)
        return heappop(heap)

In [6]:
'''
用heap方法3
T: O(nlogk) 
'''

from heapq import heapify, nlargest
class Solution:
    def findKthLargest(self, nums, k):
        heapify(nums)
        return nlargest(k, nums)[-1]

### 求第k个不同的最大最小数 kth distinct element
* 先set去重，再用heap

## Leetcode
* 215. Kth Largest Element in an Array 同1.3.1
* 347. Top K Frequent Elements （dict + heap）
* 378. Kth Smallest Element in a Sorted Matrix

In [None]:
# 347. Top K Frequent Elements 
from collections import defaultdict
from heapq import *

class Solution:
    def topKFrequent(self, nums, k):
        info = defaultdict(int)
        for i in nums:
            info[i] += 1
            
        heap = []
        res = []
        for key, value in info.items():
            heappush(heap, (-value, key))

        while k:
            res.append(heappop(heap)[1])
            k -= 1
        return res

In [None]:
# 378. Kth Smallest Element in a Sorted Matrix
# 在二维数组里面找到第k小的数

'''
按行遍历
len(heap) < k, heappush
len(heap) >= k, heappushpop
'''

class Solution:
    def kthSmallest(self, matrix, k):
       
        n = len(matrix)
        heap = []
        
        for i in range(n):
            for j in range(n):
                if len(heap) < k:
                    heappush(heap, -matrix[i][j])
                else:
                    heappushpop(heap, -matrix[i][j])
        return -heappop(heap)