# Day4 堆排序
- 笔记作者：CV七少
- 学习时间：2020.5.06
- 学习任务：Python相关算法
- 视频地址：https://www.bilibili.com/video/BV1Y7411F7hx?p=4

### 树的相关知识点：
- 树是一种可以递归定义的数据结构
- 根节点，叶子节点
- 树的深度（高度）
- 树的度
- 孩子节点/父节点
- 子树

### 两种特殊二叉树
- 满二叉树：一个二叉树，如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树
- 完全二叉树：叶节点只能出现在最下层和次下层，并且最下面一层的结点都集中在该层最左边的若干位置的二叉树

### 二叉树的存储方式
- 链式存储方式
- 顺序存储方式

### 根节点与左右孩子节点的关系
- 父节点: i    左孩子: 2i+1    右孩子：2i+2
- 反过来如果孩子节点为 i ，则父节点  $(i-1) // 2$

### 堆排序
- 大根堆：一棵完全二叉树，满足任一节点都比其孩子节点大
- 小根堆：一棵完全二叉树，满足任一节点都比其孩子节点小

In [1]:
def sift(li, low, high):
    # li 表示树， low 表示树根， haigh 表示树最后一个节点的位置
    tmp = li[low]
    i = low
    j = 2 * i + 1   # j 指向空位的左孩子
    # i 指向空位，j 指向两个孩子
    while j <= high:  # 循环退出的第二种情况：j>high,说明空位i 是叶子节点
        if j + 1 <= high and li[j] < li[j+1]: # 如果右孩子存在并且比左孩子大，指向右孩子
            j += 1
        if li[j] > tmp:
            li[i] = li[j]
            i = j
            j = 2 * i + 1
        else: # 循环退出的第一种情况：j 位置的值比tmp 小， 说明两个孩子都比tmd小
            break
    li[i] = tmp
    
    
def heap_sort(li):
    n = len(li)
    # 1. 构造堆
    for low in range(n//2-1, -1, -1):
        sift(li, low, n-1)
    # 2. 换个出数
    for high in range(n-1, -1, -1):
        li[0], li[high] = li[high], li[0]  # 退休 棋子
        sift(li, 0, high-1)
        
import random
li = list(range(7))
random.shuffle(li)
heap_sort(li)
li

[0, 1, 2, 3, 4, 5, 6]

### Python内置函数

In [2]:
import heapq

li = [9,5,7,8,2,6,4,1,3]
heapq.heapify(li)
print(li)
heapq.heappush(li, 0)
print(li)
heapq.heappop(li)
print(li)

[1, 2, 4, 3, 9, 6, 7, 8, 5]
[0, 1, 4, 3, 2, 6, 7, 8, 5, 9]
[1, 2, 4, 3, 9, 6, 7, 8, 5]


### 堆排序扩展——topK问题
现在有n个数，设计算法找出前K大的数（k<n）

解决办法：
1. 排序后切片        时间复杂度：$O(nlogn+k)$
2. LowB三人组思想     时间复杂度：$O(kn)$
3. 堆排序思想       时间复杂度：$O(nlogk)$

#### 堆的应用
解决思路：
- 取列表前k个元素建立一个小根堆。堆顶就是目前第k大的数。
- 依次向后遍历原列表，对于列表中的元素，如果小于堆顶，则忽略该元素；如果大于堆顶，则将堆顶更换为该元素，并且堆堆进行一次调整。
- 遍历列表所有元素后，倒序弹出堆顶。

In [3]:
def topk(li, k):
    heap = li[0:k]
    for i in range(k, len(li)):
        if li[i] > heap[0]:
            heap[0] = li[i]
            sift(heap, 0, k-1)
    for i in range(k-1, -1, -1):
        heap[0], heap[i] = heap[i], heap[0]
        sift(heap, 0, i-1)

In [4]:
import heapq
li = [9, 5, 7, 8, 2, 6, 4, 1, 3]

print(heapq.nlargest(5, li))
print(heapq.nsmallest(5, li))

[9, 8, 7, 6, 5]
[1, 2, 3, 4, 5]
