# 排序算法对比

排序算法分为**基于比较的算法**和**非基于比较的算法**两大类，其中基于比较的算法时间复杂度下限为$O(n^2)$，算法的实现版本较多（如：插入排序、冒泡排序、归并排序、快速排序和堆排序）。而非基于比较的算法时间复杂度下限为$O(n)$，但是需要一些额外的先验条件和内存开销（如：桶排序）。  
下表列出了常用的排序算法的复杂度和应用场景：

|算法|时间复杂度|空间复杂度|稳定性|
|:----:|:------|:---------|:-------|
| **插入排序** (Insert sort) | $O(n^2)$ | $O(1)$ | 稳定 |
| **冒泡排序** (Bubble sort) | $O(n^2)$ | $O(1)$ |  稳定 |
| **归并排序** (Merge sort) | $O(n \cdot log_2^n)$| $O(n)$ | 稳定 |
| **快速排序** (Quick sort) | 最好：$O(n \cdot log_2^n)$ <br/> 最坏：$O(n^2)$  | 最好：$O(log_2^n)$ <br/> 最坏：$O(n)$ | 不稳定 |
| **堆排序** (Heap sort) | $O(n \cdot log_2^n)$ | $O(1)$ | 不稳定 |
| **桶排序** (Bucket sort) | $O(n)$ | $O(n+ \frac{n}{m})$ | 稳定 |

# 插入排序

## 算法思想

插入排序是一种较为简单和朴素的排序方法，它每次将一个**未排序的元素插入到已排序元素中正确的位置**，逐个的对序列中的元素进行排序。在插入排序的实现过程中需要两层循环，一层用于对每个元素执行插入操作，另一层用于为执行操作的元素寻找合适的插入位置，因此时间复杂度为 $O(n^2)$。插入排序算法可以直接对输入序列进行操作，不需要额外的储存空间，因此时间复杂度为 $O(1)$。  

## 算法特点

插入排序算法属于*基于比较的算法*，且排序结果具有稳定性（即：逻辑上相等的元素在原始输入序列中的相对位置不会改变）。在目前储存空间较为廉价，而 CPU 的运行速度遇到瓶颈的背景下，该算法不适用于大规模序列的排序，但由于算法实现简单，其时间复杂度前的常数项较小，因此在一些小规模问题上可能会更快速。

In [None]:
# 插入排序实现算法。
import algviz

def insertSort(nums_):
    viz = algviz.Visualizer(delay=2)
    nums = viz.createVector(data=nums_, bar=200, show_index=False)
    # 直接从第二个元素开始。
    for i in range(1, len(nums_)):
        ii = i
        for j in range(i+1):   # 该循环用于标记已排序的元素。
            nums.mark(j, algviz.colors[0])
        for j in range(i-1, -1, -1):
            if nums[ii] < nums[j]:
                nums.swap(ii, j)
                ii = j
                viz.display()
            else:
                viz.display(1)
                break
    viz.display(1)

case1 = [3, -4, 6, 2, -5, 8, 7]
insertSort(case1)

# 冒泡排序

## 算法思想

冒泡排序和插入排序较为相似，它通过多轮扫描过程依次比较两个相邻元素的大小，如果两个元素之间是逆序的，则交换两元素的位置。假设算法从前向后扫描，每次将相邻两个元素中较大的值放到后面，那么经过该轮扫描之后，扫描过的序列中的最大值将会跑到扫描序列最后的位置，重复执行扫描过程直到所有元素都被排序即可。

**时间复杂度：** 算法需要两层循环来比较和交换元素，因此时间复杂度为 $O(n^2)$。  
**空间复杂度：** 算法可以在原输入数组上进行操作，因此时间复杂度为 $O(1)$。

## 算法特点

属于基于比较的排序算法，排序结果具有稳定性，但无论输入数据的序列如何，算法都需要进行 $O(n^2)$ 次的比较操作，因此在部分算例上该算法不如插入排序算法高效。对于大规模算例，冒泡排序更是慢的让人头皮发麻。

In [None]:
# 冒泡排序实现。
import algviz

def bubbleSort(nums_):
    viz = algviz.Visualizer(delay=2)
    nums = viz.createVector(data=nums_, bar=200, show_index=False)
    for i in range(len(nums_)):
        for j in range(len(nums_)-i-1):
            if nums[j] > nums[j+1]:
                nums.swap(j, j+1)
            viz.display()
        nums.mark(len(nums_)-i-1, algviz.colors[0])
    viz.display()
    
case2 = [7, 4, 3, 5, 1, 6]
bubbleSort(case2)

# 归并排序

## 算法思想

归并排序的思想来源于分治思想(Divide and Conquer)，分治思想包含了分割、解决和合并三个过程，下面是归并排序算法在这三个过程中的具体操作：

1. **分割：** 将要排序的序列分割成两段（一般是从中间分割），得到两个子问题。
2. **解决：** 对子问题递归的调用归并排序算法，直到子问题可以被直接解决（即子问题中只剩两个以下元素，则可以被直接比较）。
3. **合并：** 对排好顺序的子序列进行合并，从而得到原始问题的排序结果，这里通过 `merge` 操作来合并子序列，该过程也是归并排序的核心过程。

`merge` 操作每次从两个子序列的头部取出较小的元素，然后放入结果序列中，直到子序列中所有的元素都被取出为止，最后返回排序好的结果。

## 复杂度分析

+ **时间复杂度：** 我们可以借助**递归树**来分析算法的时间复杂度，递归树的最大深度为 $O(log_2^n)$，在每一层的合并操作中需要 $O(n)$ 次的基本操作，因此算法的时间复杂度为 $O(n \cdot log_2^n)$。

    ![归并排序时间辅助度分析递归树](https://s1.ax1x.com/2020/05/25/t98i11.jpg)

+ **空间复杂度：** 递归过程中的压栈深度为 $O(log_2^n)$，合并过程中需要 $O(n)$ 的辅助空间来保存合并结果，因此空间复杂度为 $O(log_2^n) + O(n)$，等价于 $O(n)$。

## 算法特点

归并排序属于基于比较的排序算法，它不仅比较稳定，在时间上也是非常高效的，但是这种算法很消耗空间，所以通常我们在**外部排序**中使用归并排序，而在**内部排序**中使用快速排序取代之。

In [None]:
# 归并排序实现。
import algviz

class MergeSort():
    '''
    nums_:list() 要排序的数组。
    '''
    def __init__(self, nums_):
        self.viz = algviz.Visualizer(2.0)
        self.nums = self.viz.createVector(nums_, name='OriginNums', bar=200, show_index=False)
        self.merge_res = self.viz.createVector(name='TempMergeNums', show_index=False)
        self.solve(0, len(nums_))
    
    '''
    l,r:int 排序数组的左右边界（左闭右开）。
    '''
    def solve(self, l, r):
        if l < r - 1:
            m = (l + r)//2
            self.solve(l, m)
            self.solve(m, r)
            self.merge(l, m, r)
    
    '''
    l,m,r:int 合并序列的左边界、中间分割点和右边界。
    '''
    def merge(self, l, m, r):
        # 标记正在处理的子序列。
        for i in range(l, r):
            self.nums.mark(i, algviz.colors[0])
        # 依次取出子序列中较小的元素放置到缓存数组中。
        ll, mm = l, m
        while ll < m and mm < r:
            if self.nums[ll] > self.nums[mm]:
                self.merge_res.append(self.nums[mm])
                mm += 1
            else:
                self.merge_res.append(self.nums[ll])
                ll += 1
            self.viz.display()
        while ll < m:
            self.merge_res.append(self.nums[ll])
            ll += 1
            self.viz.display()
        while mm < r:
            self.merge_res.append(self.nums[mm])
            mm += 1
            self.viz.display()
        # 清除标记。
        self.nums.removeMark(algviz.colors[0])
        # 将排好序的数组复制到元素序列中。
        for i in range(l, r):
            self.nums[i] = self.merge_res.pop(0)
            self.viz.display()
            
case3 = [3, -1, 4, 7, 5, 9, -3]
solver = MergeSort(case3)

# 快速排序

## 算法思想

快速排序同样使用了分治的思想，它使用了基数对子序列进行分割，并保证基数左边的序列都小于基数，而基数右边的序列都大于基数，然后对基数左右的子序列递归的分别调用快速排序算法，直到子序列中只剩一个元素。  
对比归并排序可以发现，快速排序只使用了分治思想中的**分割**和**解决**过程，在使用基数划分子序列的过程中，实际上已经进行了排序工作，这说明分治思想的应用是非常灵活的，不同的算法可以根据实际特点进行灵活调整。

## 复杂度分析

+ **时间复杂度：** 同样使用递归树进行分析，在递归树的每一层所需要进行的划分操作都为 $O(n)$ ，但由于**在快速排序中，子序列的划分不一定是左右平衡的，这跟基数的选择有关**，所以递归树的深度是不确定的。如果我们足够幸运，在每次的划分中左右两个子序列的长度都刚好是相等的，那么递归树的深度就是 $O(log_2^n)$，但如果我们足够倒霉，每次划分时其中一个子序列的长度都为0，那么递归树的深度就是 $O(n)$，因此，快速排序的时间复杂度在 $O(n \cdot log_2^n)$ ~ $O(n^2)$ 之间。幸运的是，实际情况中的序列往往是趋于均匀分布的，如果我们随机的选择基数进行划分，那么递归树大概率是平衡的，所以实际应用中快速排序的时间复杂度接近于 $O(n \cdot log_2^n)$。
+ **空间复杂度：** 子序列的划分过程可以在原始数组中进行，所需要的内存空间为常数，因此快速排序算法的空间复杂度只与递归树的深度有关。在时间复杂度的分析中，我们得出了递归树的深度在 $O(log_2^n)$ ~ $O(n)$ 之间，因此空间复杂度也是该范围。

## 算法特点

在基于比较的排序算法中，快速排序的时间效率是最高的，而在实际的应用场景中，它所需要的储存空间也比归并排序少，因此快速排序在处理大规模问题的求解过程中有很大优势。但是快排算法是不稳定的，所以在对稳定性有要求的场景中不能使用快排算法。

In [None]:
# 快速排序算法实现。
import algviz

class QuickSort():
    def __init__(self, nums_):
        self.viz = algviz.Visualizer(2.0)
        self.nums = self.viz.createVector(nums_, bar=200, show_index=False)
        self.solve(0, len(nums_))
    
    def solve(self, l, r):
        if l >= r - 1:
            return
        for i in range(l, r):
            self.nums.mark(i, algviz.colors[0])
        nb_left = l                         # 记录左子序列长度。
        for i in range(l, r-1):
            if self.nums[i] < self.nums[r-1]:
                self.nums.swap(i, nb_left)  # 把比基数小的数收集到序列左侧。
                nb_left += 1
                self.viz.display()
            else:
                self.viz.display(1.0)
        self.nums.swap(nb_left, r-1)
        self.nums.removeMark(algviz.colors[0])
        self.viz.display()
        self.solve(l, nb_left)
        self.solve(nb_left+1, r)            # 注意这里nb_left要加1。

case4 = [-4, 4, -6, 3, -3, 1, 3]
solver = QuickSort(case4)

# 堆排序

## 堆的介绍

### 堆的定义

堆是一种**使用数组表示的完全二叉树对象**，根据父子节点大小关系的不同，可以将堆分为**大根堆**（根节点的值最大）和**小根堆**（根节点的值最小）。一个大根堆总是满足如下性质：

1. 堆中任意节点的值总是不大于其父节点的值。
2. 堆代表的总是一颗完全二叉树。

<img src="https://www.geeksforgeeks.org/wp-content/uploads/MinHeapAndMaxHeap.png" alt="堆的示意图" width="400" />

**性质1**和二叉搜索树的性质有一些相似之处，不同的是堆中没有限制同一个节点的左右子节点之间的大小关系，而二叉搜索树则规定了左子节点不大于右子节点。  
**性质2**方便在数组上对堆进行操作，对应数学上的定义即为：表示大根堆的序列 $n_0, n_1, n_2 ... n_k$ 中的元素需满足条件 $n_i \geq n_{2i+1} \land n_i \geq n_{2i+2} , \forall i \in 0, 1, 2 ... \frac{k-1}{2}$。

### 堆的基本操作

+ `parent` 获取当前节点的父节点索引，直接返回 $\frac{(i-1)}{2}$ 即可。
+ `left` 获取当前节点的左子节点索引，直接返回 $2i + 1$ 即可。
+ `right` 获取当前节点的右子节点索引，直接返回 $2i + 2$ 即可。
+ `adjust` 用于调整索引i处的节点在堆中的位置，以保证堆的**性质1**始终满足，该操作通过比较当前节点和它的两个子节点的相对大小，并将违反性质1的节点和其子节点位置进行交换。然后递归的进行该过程，直到当前节点满足性质1或达到叶子节点的位置。
+ `make_heap` 建立一个堆，将数组中的非叶子节点数据，按照从后向前的顺序依次调用 `adjust` 调整其在堆中的位置。

## 堆排序思路

堆排序是利用了堆这种数据结构的特点，如果我们想要得到一个递增的序列，可以使用大根堆，否则使用小根堆。堆排序算法按照下面的过程进行操作：

1. 根据输入数据建立堆，该过程可以在输入数组上进行原址操作。
2. 交换堆顶元素和堆的末尾未排序元素的位置。
3. 调用 `adjust(i)` 操作维护堆的性质。
4. 重复步骤2-3直到所有元素都已被排序。

## 算法复杂度分析

+ **时间复杂度：** `adjust` 操作的时间复杂度和堆的高度相关（即：为 $O(log_2^n)$），而在 `make_heap` 的操作中我们需要对每个元素执行一次 `adjust` 操作，在步骤2-4中也需要对每个元素执行一次 `adjust` 操作，因此堆排序的时间复杂度为 $O(n \cdot log_2^n)$ 。
+ **空间复杂度：** 堆排序中所有的操作都可以在原输出序列上直接进行，因此不需要额外的储存空间，空间复杂度为 $O(1)$ 。

## 扩展

+ 为什么数组长度不是 $2^n$ 时算法仍然可行？

In [None]:
# 堆排序实现。
import algviz

class HeapSort():
    def __init__(self, nums_):
        self.viz = algviz.Visualizer()
        self.heap = self.viz.createVector(nums_, bar=200)
        self.heap_len = len(nums_)        # 堆的长度会不断减小。
        # 对应make_heap过程。
        for i in range((len(nums_)-1)//2, -1, -1):
            self.adjust(i)
        # 交换堆顶和堆尾元素。
        for i in range(len(nums_)-1, -1, -1):
            self.heap.swap(0, i)
            self.heap.mark(i, algviz.colors[0])
            self.heap_len -= 1
            self.viz.display(2)
            self.adjust(0)
    
    def adjust(self, index):
        left, right = index*2 + 1, index*2 + 2
        max_index = index
        if left < self.heap_len and self.heap[index] < self.heap[left]:
            max_index = left
        if right < self.heap_len and self.heap[max_index] < self.heap[right]:
            max_index = right
        self.viz.display(1)
        if max_index != index:
            self.heap.swap(index, max_index)
            self.viz.display(2)
            self.adjust(max_index)
        
case5 = [2, 1, 5, 3, -3, 7, 4]
solver = HeapSort(case5)

# 桶排序

## 算法思想

桶排序算法假设输入的数据在一定的范围内且服从均匀分布，并根据数据的范围设置一定数量的桶，然后将输入序列依次分配到各个桶中，之后对桶中的序列进行排序，最后再依次从桶中按顺序取出排好序的元素。

## 复杂度分析

+ **时间复杂度：** 跟桶的设置有关，如果桶的数量足够多，以保证每个桶中只有一个元素，那么时间复杂度为 $O(n)$，但如果所有的元素都集中在一个桶中，那么桶排序就退化成了桶内使用的排序算法。
+ **空间复杂度：** 跟桶的数量和桶内排序使用的算法有关，假设我们设置m个桶，并选择使用归并或快速排序作为桶内排序算法，那么空间复杂度为 $O(m+ \frac{n}{m})$。

## 算法特点

桶排序是非基于比较的排序算法，它需要对输出的数据作一定的假设（或先验知识），适用于数据跨度不大的问题求解。但是桶排序可能会占用过多的储存空间，因此在实际应用中桶排序的使用较少。

In [None]:
# 桶排序算法实现（为了简单，这里桶内排序采用直接插入的方法）。
import algviz

# nb_bucket表示桶的数量，默认为5个。
def bucketSort(nums_, nb_bucket=5):
    viz = algviz.Visualizer(2)
    buckets = list()
    buckets.append(viz.createVector(cell_size=20, name='Bucket', show_index=False))
    for i in range(1, nb_bucket):
        buckets.append(viz.createVector(cell_size=20, show_index=False))
    result = viz.createVector(name='Result')
    min_val = min(nums_)
    max_val = max(nums_)
    num_step = (max_val - min_val + 1)/nb_bucket
    for num in nums_:
        index = int((num-min_val)/num_step)    # 元素放到哪个桶中。
        # 查找合适的元素插入位置。
        for j in range(0, len(buckets[index])):
            if num < buckets[index][j]:
                buckets[index].insert(j, num)
                break
        if not len(buckets[index]) or num > buckets[index][-1]:
            buckets[index].append(num)
        viz.display()
    # 将桶中元素放回结果中。
    for i in range(nb_bucket):
        for j in range(len(buckets[i])):
            result.append(buckets[i][j])
            viz.display()

case6 = [4, 6, -3, 7, -1, -6, 5, 2]
bucketSort(case6)

# 参考链接

+ [十大经典排序算法+动图演示](https://www.cnblogs.com/onepixel/articles/7674659.html)
+ [VisuAlgo算法可视化网站](https://visualgo.net/en)
+ [归并排序](https://www.geeksforgeeks.org/merge-sort/)
+ [堆排序介绍](https://www.cnblogs.com/chengxiao/p/6129630.html)
+ [桶排序介绍](http://data.biancheng.net/view/115.html)