# 排序

本节介绍各种排序算法的思路和特点，并提供了示例代码。

1. 插入排序
    - 直接插入排序
    - 希尔排序
2. 交换排序
    - 冒泡排序
    - 快速排序
3. 选择排序
    - 简单选择排序
    - 堆排序
4. 归并排序
    - 二路归并排序

In [1]:
# 初始化
# 待排序数组
from random import randint
nums = [randint(0, 15) for _ in range(20)]

# 用于监测运行时间的装饰器
from time import time
def timer(func):
    def f(*args):
        before = time()
        rv = func(*args)
        after = time()
        print('time taken:', "{:.10f}ms".format((after-before)*1000))
        return rv
    return f

## 1. 插入排序

### 1.1 直接插入排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    内排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: O(n^2)
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(1)
</span>

插入排序是将第 i 个元素插入前 i-1 个已排序数组中。

In [2]:
@timer
def insertion_sort(nums):
    for i in range(1, len(nums)):
        if nums[i-1] > nums[i]:
            tmp = nums[i]  # 设置检测哨
            while i > 0 and nums[i-1] > tmp:
                nums[i] = nums[i-1]  # 若当前元素小于监测哨，则将其后移一个位置
                i -= 1
            nums[i] = tmp  # 插入存储在监测哨中的值
    return nums

insertion_sort(nums[:])

time taken: 0.0209808350ms


[0, 0, 0, 2, 4, 4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 13]

### 1.2 希尔排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    不稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    内排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: 难以判断
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(1)
</span>

希尔排序是插入排序的升级版。

我们来看下希尔排序的基本步骤，在此我们选择增量 `gap=len(nums)/2`，缩小增量继续以 `gap = gap//2` 的方式。这种增量选择我们可以用一个序列来表示，`[n//2, (n//2)//2, … , 1]`，称之为增量序列。希尔排序的增量序列的选择与证明是个数学难题，我们选择的这个增量序列是比较常用的，也是希尔建议的增量，称为希尔增量，但其实这个增量序列不是最优的。

具体算法描述：

步骤1：选择一个增量序列 $t_1，t_2，…，t_k$，其中对于任意 $i, j$ 有 $t_i>t_j, (i < j)$，且 $t_k=1$；

步骤2：设增量序列为 `d`，则需对序列进行 `len(d)` 趟排序；

步骤3：每趟排序，根据对应的增量 $t_i$，将待排序列分割成若干子表，分别对各子表进行直接插入排序。当增量因子为 1 时，整个序列作为一个表来处理，表长度即为整个序列的长度。

<img src="../img/shell_sort.png" style="float:left;height:375px;"></img>

In [3]:
@timer
def shell_sort(nums):
    n = len(nums)
    gap = n // 2
    while gap:
        for i in range(gap, n):
            tmp = nums[i]
            while i > 0 and nums[i-gap] > nums[i]:
                nums[i] = nums[i-gap]
                i -= gap
            nums[i] = tmp
        gap //= 2
    return nums

shell_sort(nums[:])

time taken: 0.0178813934ms


[0, 0, 2, 4, 4, 6, 7, 7, 6, 7, 0, 8, 9, 8, 9, 10, 10, 10, 11, 13]

注：你可能发现直接插入排序的 time taken 比希尔排序的要小，这是因为问题的规模太小了。试着将 `nums` 的规模增大到 1000，你会发现希尔排序大大优于直接插入排序。

## 2. 交换排序

### 2.1 冒泡排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    内排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: O(n^2)
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(1)
</span>

设排序表为 r（`len(r)` 为 n），算法过程如下：

第1趟，从第2个元素到第n个元素，比较元素`r[i]`和`r[i-1]`，若与排序要求相逆，则将两元素位置互换。这样，一趟之后，具有最大值的元素被交换到了数组的末尾。

第2趟，从第2个元素到第n-1个元素，继续上述过程，将`r[:n-1]`中最大的元素交换到`r[n-2]`的位置。

冒泡排序最多进行n-1趟。在某趟的两两比较过程中，如果一次交换都未发生，表明已经有序，则排序提前结束。

In [4]:
@timer
def bubble_sort(nums):
    n = len(nums)
    for i in range(n-1):
        swap = 1
        for j in range(1, n-i):
            if nums[j] < nums[j-1]:
                nums[j-1], nums[j] = nums[j], nums[j-1]
                swap = 0
        if swap:
            break
    
    return nums

bubble_sort(nums[:])

time taken: 0.0312328339ms


[0, 0, 0, 2, 4, 4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 13]

### 2.2 快速排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    不稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    内排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: O(nlogn) ~ O(n^2)
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(logn) ~ O(n)
</span>

快速排序的核心操作是**划分**。以某个元素为标准（也称为**支点**），通过划分将待排序列分成两组，其中一组中所有元素的值均**大于等于**支点的值，另一组所有元素的值均**小于**支点的值，则支点元素就在两组之间，这也是该元素的最终位置。再对各部分继续划分，直到整个序列全部有序。

In [5]:
def partition(res, left, right):
    tmp = res[left]
    while left < right:
        while left < right and res[right] >= tmp:
            right -= 1
        if left < right:
            res[left] = res[right]
            left += 1
        while left < right and res[left] < tmp:
            left += 1
        if left < right:
            res[right] = res[left]
            right -= 1
    res[left] = tmp
    return left

def quick_sort(nums, left, right):
    if left < right:
        i = partition(nums, left, right)
        quick_sort(nums, left, i-1)
        quick_sort(nums, i+1, right)

@timer
def main():
    new_nums = nums[:]
    n = len(new_nums)
    quick_sort(new_nums, 0, n-1)
    return new_nums

print(main())

time taken: 0.0193119049ms
[0, 0, 0, 2, 4, 4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 13]


从空间效率看，快速排序是递归的，每层递归调用时的指针和参数均要用栈来存放，递归调用层次数与上述二叉树的深度一致。因而，存储开销在理想情况下为 $O(log_2 n)$，即树的高度；在最坏情况下，即二叉树是一个单链，为 $O(n)$。

从时间效率看，在n个元素的待排序列中，一次划分需要约n次比较，时效为 $O(n)$。理想情况下，每次划分正好分成两个等长的子序列，时效为 $O(nlog_2 n)$。最坏情况下，每次划分只得到一个子序列，时效为 $O(n^2)$。

## 3. 选择排序

### 3.1 简单选择排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    不稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    内排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: O(n^2)
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(1)
</span>

选择排序每趟从待排序列中选取一个最小的元素，即第1趟从n个元素中选取最小的元素，第2趟从剩下的n-1个元素中选取最小的元素，直到整个序列的元素都选取完毕。这样最终得到整体有序的序列。

In [6]:
@timer
def selection_sort(nums):
    n = len(nums)
    for i in range(n-1):
        index = i
        for j in range(i+1, n):
            if nums[j] < nums[index]:
                index = j
        if index != i:
            nums[i], nums[index] = nums[index], nums[i]
    
    return nums

selection_sort(nums[:])

time taken: 0.0200271606ms


[0, 0, 0, 2, 4, 4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 13]

### 3.2 堆排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    不稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    内排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: O(n^2)
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(1)
</span>

简单选择排序的思想简单，易于实现，但其时间性能没有优势。这是因为在每趟的选择中，没有把前面选择过程中的一些有用信息继承下来，因此每趟选择都按顺序一一进行。如果某一趟选择能够把前面有用的一些信息继承下来，则定会减少本趟的比较次数，提高排序效率，堆排序就做到了这一点。

小顶堆的定义：

$$\mathrm{k}_{\mathrm{i}} \leqslant\left\{\begin{array}{l}
\mathrm{k}_{2 \mathrm{i}} \\
\mathrm{k}_{2 \mathrm{i}+1}
\end{array} \quad(\mathrm{i}=1,2, \cdots, \mathrm{n} / 2)\right.$$

大顶堆的定义：

$$\mathrm{k}_{\mathrm{i}} \geqslant\left\{\begin{array}{l}
\mathrm{k}_{2 \mathrm{i}} \\
\mathrm{k}_{2 \mathrm{i}+1}
\end{array} \quad(\mathrm{i}=1,2, \cdots, \mathrm{n} / 2)\right.$$

例如，序列12，36，24，85，47，30，53，91是一个小顶堆；序列91，47，85，24，36，53，30，16是一个大顶堆。

一个有n个元素的序列作成堆，可以和一棵完全二叉树对应起来，i 和 2i、2i+1 的关系就是双亲与其左、右孩子之间的位置关系（i=1，2，……，n/2）。

下述代码展示了如何将序列转换为一棵完全二叉树。

In [7]:
demos = [randint(0, 99) for _ in range(20)]
def show_heap(nums):
    if not all([i < 100 for i in nums]):
        return "number must be less than 100."
    n = len(nums)
    print("id: ", end="")
    print("   "+" ".join([str(i) if len(str(i)) > 1 else " "+str(i) for i in range(1, n+1)]))
    print("val:", end="")
    print("   "+" ".join([str(i) if len(str(i)) > 1 else " "+str(i) for i in nums]))
    space = ["  " for _ in range(n+1)]
    for i in range(1, n+1):
        tmp = space[:]
        tmp[i] = " O"
        flag = 1
        if 2*i < n+1:
            tmp[2*i] = " L"
            flag = 0
        if 2*i+1 < n+1:
            tmp[2*i+1] = " R"
        if flag:
            break
        print("    ", end="")
        print("|".join([str(i) for i in tmp])+"|")

print("O -- 根节点")
print("L -- 左孩子")
print("R -- 右孩子", end="\n\n")
show_heap(demos)

O -- 根节点
L -- 左孩子
R -- 右孩子

id:     1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20
val:   91 57 72 73 34 84 29 13 62 20 91 39 77 25 97 94 44 42 23 83
      | O| L| R|  |  |  |  |  |  |  |  |  |  |  |  |  |  |  |  |  |
      |  | O|  | L| R|  |  |  |  |  |  |  |  |  |  |  |  |  |  |  |
      |  |  | O|  |  | L| R|  |  |  |  |  |  |  |  |  |  |  |  |  |
      |  |  |  | O|  |  |  | L| R|  |  |  |  |  |  |  |  |  |  |  |
      |  |  |  |  | O|  |  |  |  | L| R|  |  |  |  |  |  |  |  |  |
      |  |  |  |  |  | O|  |  |  |  |  | L| R|  |  |  |  |  |  |  |
      |  |  |  |  |  |  | O|  |  |  |  |  |  | L| R|  |  |  |  |  |
      |  |  |  |  |  |  |  | O|  |  |  |  |  |  |  | L| R|  |  |  |
      |  |  |  |  |  |  |  |  | O|  |  |  |  |  |  |  |  | L| R|  |
      |  |  |  |  |  |  |  |  |  | O|  |  |  |  |  |  |  |  |  | L|


具体算法描述（以大顶堆为例）：

步骤1: 将n个元素建成大顶堆，将堆顶元素输出。

步骤2: 为了更多地继承原来堆的特性，不是对 $R_2$ 到 $R_n$ 调整，而是将原堆底元素 $R_n$ 移入堆顶位置，然后对 $R_1$ 到 $R_{n-1}$ 调整。这样，调整背景是：只有 $R_1$ 与其左右孩子之间可能不满足堆的特性，而其他地方均满足堆的特性。调整成堆之后，继续问题的重复。如此反复，可以得到一个完全有序的序列。

In [8]:
def heap_adjust(nums, s, t):
    """建大顶堆"""
    rc = nums[s]
    i = s  # 双亲节点的索引
    j = 2 * i  # 左孩子的索引
    while j <= t:
        if j < t and nums[j] < nums[j+1]:  # 如果右孩子存在且右孩子的值大于左孩子
            j += 1  # 索引指向右孩子（即指向左右孩子中值较大的元素）
        if rc > nums[j]:  # 如果双亲节点的值大于左右孩子
            break  # 那没事了
        nums[i] = nums[j]  # 否则，把双亲节点的值换成左右孩子中较大的那个
        i = j  # 继续向下整理成堆
        j *= 2
    nums[i] = rc
    return nums

@timer
def heap_sort(nums):
    nums = [None]+nums
    n = len(nums) - 1
    for i in range(n//2, 0, -1):
        nums = heap_adjust(nums, i, n)
    for i in range(n, 0, -1):
        nums[1], nums[i] = nums[i], nums[1]
        nums = heap_adjust(nums, 1, i-1)
    
    return nums[1:]

heap_sort(nums[:])

time taken: 0.0257492065ms


[0, 0, 0, 2, 4, 4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 13]

## 4. 归并排序


### 4.1 二路归并排序

<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    稳定排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    外排序
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    时间复杂度: O(nlogn)
</span>
<span style="color: #fff !important;background-color: #0088cc;display: inline-block;padding: 0.3em 0.4em;font-size: 1.25rem;font-weight: bold;line-height: 1;text-align: center;white-space: nowrap;vertical-align: baseline;border-radius: 0.25rem; margin: 0.75em 0em 0 0;">
    空间复杂度: O(n)
</span>

二路归并的基本思想是：只有一个元素的列表总是有序的，所以将序列 `l` (`len(l) = n`) 看作 n 个长度为 1 的有序子表；对相邻的两个有序子表两两合并到一个新列表中，使之生成长度为 2 的有序子表；...... 直到最后生成表长为 n 的有序列表。这个过程需要 $log_2 n$ 趟。

In [9]:
def merge_sort(nums):
    if len(nums) <= 1:
        return nums
    mid = len(nums) // 2
    left = merge_sort(nums[:mid])
    right = merge_sort(nums[mid:])
    return merge(left, right)

def merge(left, right):
    res = []
    i, j = 0, 0
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            res.append(left[i])
            i += 1
        else:
            res.append(right[j])
            j += 1
    res += left[i:]
    res += right[j:]
    return res

merge_sort(nums[:])

[0, 0, 0, 2, 4, 4, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 10, 11, 13]

> 注：关于外排序
> 
> 排序分为内排序和外排序：内排序是将待排序列的元素全部存在内存的排序；外排序是对存放在外存的文件中的海量数据的排序。外排序基于对有序归并段的归并，而初始归并段的产生又基于内排序。

参考：

- 《数据结构与算法》 张小莉，王苗，罗文编著
- [leetcode@powcai](https://leetcode-cn.com/problems/sort-an-array/comments/319489)