### 堆
>堆是图的一种树形结构，被用于实现“优先队列”。优先队列是种数据结构，自由添加数据，取出数据时候先取出最小的值。

>作为选择排序的改进版，堆排序可以把每一趟元素的比较结果保存下来，以便我们在选择最小/大元素时对已经比较过的元素做出相应的调整。堆排序是一种树形选择排序，在排序过程中可以把元素看成是一颗完全二叉树，每个节点都大（小）于它的两个子节点.
- 当每个节点都大于等于它的两个子节点时，就称为大顶堆，也叫堆有序
- 当每个节点都小于等于它的两个子节点时，就称为小顶堆

#### 算法思想
>算法思想(以大顶堆为例)：

1.将长度为n的待排序的数组进行堆有序化，构造成一个大顶堆
 
2.将根节点与尾节点交换，并输出此时的尾节点
 
3.将剩余的n -1个节点重新进行堆有序化
 
4.重复步骤2，步骤3直至构造成一个有序序列

#### 特点
- 堆的节点中存储的是数据
- 每个节点最多两个子节点
- 子节点的数据必须大于父节点
- 最小值存储于最顶端，即根节点的位置上
- 树的形状取决于数据的个数
- 节点的排列顺序：
     - 从左到右
     - 从上到下
     
#### 输入数据
- 插入左右边，再和父节点比较
- 如果比父节点小，交换位置
- 重复上面的步骤，直至父节点都是小于子节点

#### 取出数据
- 先取出根节点的数据
- 将最右端的数据放在根节点上
- 再进行父节点和子节点的比较，满足父节点<子节点
- 比较顺序：左右，上下

#### 时间复杂度
- 取出顶端数据的复杂度是O(1)
- 假设数据量是n，树的高度是$log_2{n}$，时间复杂度是$O(log_2{n})

### 二叉树
二叉查找树是一种树形结构，采用了图的树形结构。每个节点最多两个子节点
- 平衡二叉树：修正不均衡的树，保持均衡状态，提高查找效率
- B树：每个节点不止一个子节点，可以多个；MySQL中用到了B树

特点：
- 每个节点的值均大于其左子树上任意一个节点的值：`大于左边`
- 每个节点的值均小于其右子树上任意一个节点的值：`小于右边`


In [1]:
def heapify(arr, n, i): 
    largest = i  
    l = 2 * i + 1     
    r = 2 * i + 2 
    
    if l < n and arr[i] < arr[l]: 
        largest = l 
    if r < n and arr[largest] < arr[r]: 
        largest = r 
        
    if largest != i: 
        arr[i],arr[largest] = arr[largest],arr[i]  # 交换

        heapify(arr, n, largest) 

def heapSort(arr): 
    n = len(arr) 
    # Build a maxheap. 
    for i in range(n, -1, -1): 
        heapify(arr, n, i) 
    # 一个个交换元素
    for i in range(n-1, 0, -1): 
        arr[i], arr[0] = arr[0], arr[i]   # 交换
        heapify(arr, i, 0)      
    return arr

In [2]:
arr = [ 12, 11, 13, 5, 6, 7] 
heapSort(arr)

[5, 6, 7, 11, 12, 13]

In [3]:
# 如何堆化一个数组 

def heapify(alist, n, i):
    while i < n:
        c1 = 2 * i + 1
        c2 = 2 * i + 2
        max = i
        if c1 < n and alist[c1] > alist[max]:
            max = c1
        if c2 < n and alist[c2] > alist[max]:
            max = c2
        if max != i:
            alist[max], alist[i] = alist[i], alist[max]
            heapify(alist, n, max)

        return alist

In [4]:
alist=[4, 10, 3, 5, 1, 2]
heapify(alist, 6, 0)

[10, 5, 3, 4, 1, 2]

In [5]:
def heapify(alist, n, i):
    # 单个子树的堆化过程
    
    # 左右子树的下标
    c1 = 2 * i + 1
    c2 = 2 * i + 2
    
    # 假设下标为i的节点最大，然后和左右两个子节点进行比较和交换动作
    max = i
    if c1 < n and alist[c1] > alist[max]:
        max = c1
    if c2 < n and alist[c2] > alist[max]:
        max = c2
    if max != i:   # 如果上面两个if中有一直执行，则max会变成c1或者c2，此时max不再是i，需要进行交换
        alist[max], alist[i] = alist[i], alist[max]   # 实质上是把alist[c1]或者alist[c2]的值和alist[i]进行交换
        heapify(alist, n, max)  # 交换完之后再对底层的进行递归堆化，max已经是c1或者c2
            
def build_heap(alist, n):
    # 整个堆的建立
    last_node = n - 1   # 最后一个节点的下标
    parent = int((last_node - 1) / 2)  # 此节点的父节点下标，注意数据类型，需要int强制转换
    for i in range(parent + 1, -1, -1):  # 构建节点的下标递减1，视频中：3--->2--->1--->0
        heapify(alist, n, i)  # 递归构建堆 

def heap_sort(alist, n):
    # 堆排序
    # 将根节点和最后的节点的值进行交换，取出根节点的值（大）
    # 此时破坏了堆的结构，重新构建堆，调用heapify()
    build_heap(alist, n)
    for i in range(n-1, -1, -1):   # (n-1, 0, -1)也是可以的，最后的一个可以不用比较，直接取出来
        alist[i], alist[0] = alist[0], alist[i]
        heapify(alist, i, 0) 

    return alist


In [6]:
alist = [3, 9, 2, 8, 7, 4, 6, 1, 5, 10]
res = heap_sort(alist, 10)
print(res)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
