# 排序

https://zhuanlan.zhihu.com/p/57270323

## 算法复杂度

| 排序方法 | 时间复杂度（平均）  | 时间复杂度（最坏） | 时间复杂度（最好） | 空间复杂度 | 稳定性 |
|:--------| :---------:|:--------:|:------------:|:-----------:|:-----------:|
|插入排序|$O(n^2)$|$O(n^2)$|$O(n)$|$O(1)$|稳定|
|希尔排序|$O(n^{1.3})$|$O(n^2)$|$O(n)$|$O(1)$|不稳定|
|选择排序|$O(n^2)$|$O(n^2)$|$O(n^2)$|$O(1)$|不稳定|
|堆排序|$O(n\log_2n)$|$O(n\log_2n)$|$O(n\log_2n)$|$O(1)$|不稳定|
|冒泡排序|$O(n^2)$|$O(n^2)$|$O(n)$|$O(1)$|稳定|
|快速排序|$O(n\log_2n)$|$O(n^2)$|$O(n\log_2n)$ | O(n\log_2n)|不稳定|
|归并排序|$O(n\log_2n)$|$O(n\log_2n)$|$O(n\log_2n)$|$O(n)$|稳定|
|计数排序|$O(n+k)$|$O(n+k)$|$O(n+k)$|$O(n+k)$|稳定|
|桶排序|$O(n+k)$|$O(n^2)$|$O(n)$|$O(n+k)$|稳定|
|基数排序|$O(n*k)$|$O(n*k)$|$O(n*k)$|$O(n*k)$|稳定|

稳定： 若a原本在b前面，而a = b， 排序后a任然在b前面则排序稳定，否则不稳定

## 冒泡排序

比较相邻元素，若第一个比第二个大，就交换他们两个；这样每一次都能确定一个最大的数。重复以上步骤n-1次。

In [5]:
from typing import List
def bubblesort(nums: List[int]) -> List[int]:
    n = len(nums)
    for i in range(n-1):
        for j in range(n-i-1):
            if nums[j] > nums[j+1]: 
                nums[j], nums[j+1] = nums[j+1], nums[j]
    return nums

In [6]:
nums = [4,6,5,3,1,2]

In [7]:
bubblesort(nums)

[1, 2, 3, 4, 5, 6]

## 选择排序

首先在未排序序列中找到最小元素，存放到排序序列的起始位置。然后，再从剩余未排序元素中继续寻找最小元素，然后放到已排序序列的末尾。以此类推，直到所有元素均排序完毕。

In [9]:
def selectsort(nums: List[int]) -> List[int]:
    n = len(nums)
    for i in range(n-1):
        cur = i
        for j in range(i, n):
            if nums[j] < nums[cur]: nums[j], nums[cur] = nums[cur], nums[j]
    return nums

In [10]:
selectsort(nums)

[1, 2, 3, 4, 5, 6]

## 堆排序

「堆排序 heap sort」是一种基于堆数据结构实现的高效排序算法。我们可以利用已经学过的“建堆操作”和“元素出堆操作”实现堆排序。

输入数组并建立大顶堆，此时最大元素位于堆顶。
不断执行出堆操作，依次记录出堆元素，即可得到从小到大排序的序列。
以上方法虽然可行，但需要借助一个额外数组来保存弹出的元素，比较浪费空间。在实际中，我们通常使用一种更加优雅的实现方式。

非稳定排序：在交换堆顶元素和堆底元素时，相等元素的相对位置可能发生变化。

In [None]:
def sift_down(nums: list[int], n: int, i: int):
    """堆的长度为 n ，从节点 i 开始，从顶至底堆化"""
    while True:
        # 判断节点 i, l, r 中值最大的节点，记为 ma
        l = 2 * i + 1
        r = 2 * i + 2
        ma = i
        if l < n and nums[l] > nums[ma]:
            ma = l
        if r < n and nums[r] > nums[ma]:
            ma = r
        # 若节点 i 最大或索引 l, r 越界，则无须继续堆化，跳出
        if ma == i:
            break
        # 交换两节点
        nums[i], nums[ma] = nums[ma], nums[i]
        # 循环向下堆化
        i = ma

def heap_sort(nums: list[int]):
    """堆排序"""
    # 建堆操作：堆化除叶节点以外的其他所有节点
    for i in range(len(nums) // 2 - 1, -1, -1):
        sift_down(nums, len(nums), i)
    # 从堆中提取最大元素，循环 n-1 轮
    for i in range(len(nums) - 1, 0, -1):
        # 交换根节点与最右叶节点（交换首元素与尾元素）
        nums[0], nums[i] = nums[i], nums[0]
        # 以根节点为起点，从顶至底进行堆化
        sift_down(nums, i, 0)

In [122]:
def heapify(nums, n, idx):
    """堆化以 idx 为根节点的子树"""
    child = 2 * idx + 1
    while child < n:
        # 找到最大的孩子
        if (child + 1) < n and nums[child + 1] > nums[child]:
            child += 1
        # 交换父子节点（如果满足条件）
        if nums[idx] < nums[child]:
            nums[idx], nums[child] = nums[child], nums[idx]
        # 继续向下堆化
        idx = child
        child = 2 * idx + 1

def heap_sort(nums):
    n = len(nums)
    # 先通过 nums 建立起堆
    for i in range(n // 2, -1, -1):
        heapify(nums, n, i)
    # 每次将最大值放在后方，再建一次堆
    for i in range(n - 1, 0, -1):
        nums[0], nums[i] = nums[i], nums[0]
        heapify(nums, i, 0)
        

In [123]:
import random

nums = [random.randint(0, 10) for _ in range(10)]
print(nums)
heap_sort(nums)
print(nums)

[3, 9, 9, 0, 5, 0, 4, 1, 0, 8]
[0, 0, 0, 1, 3, 4, 5, 8, 9, 9]


## 快排

「快速排序 quick sort」是一种基于分治策略的排序算法，运行高效，应用广泛。

快速排序的核心操作是“哨兵划分”，其目标是：选择数组中的某个元素作为“基准数”，将所有小于基准数的元素移到其左侧，而大于基准数的元素移到其右侧。

快速排序的整体流程为：

- 首先，对原数组执行一次“哨兵划分”，得到未排序的左子数组和右子数组。
- 然后，对左子数组和右子数组分别递归执行“哨兵划分”。
- 持续递归，直至子数组长度为 1 时终止，从而完成整个数组的排序。

In [15]:
def partition(nums: list[int], left: int, right: int) -> int:
    """哨兵划分"""
    # 以 nums[left] 为基准数
    i, j = left, right
    while i < j:
        while i < j and nums[j] >= nums[left]:
            j -= 1  # 从右向左找首个小于基准数的元素
        while i < j and nums[i] <= nums[left]:
            i += 1  # 从左向右找首个大于基准数的元素
        # 元素交换
        nums[i], nums[j] = nums[j], nums[i]
    # 将基准数交换至两子数组的分界线
    nums[i], nums[left] = nums[left], nums[i]
    return i  # 返回基准数的索引

def quick_sort(nums: list[int], left: int, right: int):
    """快速排序"""
    # 子数组长度为 1 时终止递归
    if left >= right:
        return
    # 哨兵划分
    pivot = partition(nums, left, right)
    # 递归左子数组、右子数组
    quick_sort(nums, left, pivot - 1)
    quick_sort(nums, pivot + 1, right)

In [16]:
nums = [random.randint(0, 10) for _ in range(10)]
print(nums)
quick_sort(nums, 0, len(nums) - 1)
print(nums)

[6, 3, 5, 1, 1, 7, 6, 5, 0, 8]
[0, 1, 1, 3, 5, 5, 6, 6, 7, 8]


In [27]:
def partition(nums, left, right):
    i, j = left, right
    while i < j:
        while i < j and nums[j] >= nums[left]:
            j -= 1
        while i < j and nums[i] <= nums[left]:
            i += 1
        nums[i], nums[j] = nums[j], nums[i]
    # NOTE: 这里体现了快排的不稳定性，基准数可能会被交换到相同元素的右侧
    nums[i], nums[left] = nums[left], nums[i]
    # NOTE: 1. 这里返回 i j 均可；
    return i

def quick_sort(nums, left, right):
    if (left >= right): return
    pivot = partition(nums, left, right)
    # NOTE: 这里只要保证两端不都是 pivot 就行，如 pivot - 1, pivot
    quick_sort(nums, left, pivot - 1)
    quick_sort(nums, pivot + 1, right)

In [28]:
import random

nums = [random.randint(0, 10) for _ in range(10)]
print(nums)
quick_sort(nums, 0, len(nums) - 1)
print(nums)

[2, 1, 9, 0, 3, 5, 8, 3, 7, 0]
[0, 0, 1, 2, 3, 3, 5, 7, 8, 9]


### 快排的基准数优化

我们可以在数组中选取三个候选元素（通常为数组的首、尾、中点元素），并将这三个候选元素的中位数作为基准数。这样一来，基准数“既不太小也不太大”的概率将大幅提升。

In [39]:
def median_three(nums: list[int], left: int, mid: int, right: int) -> int:
    """选取三个元素的中位数"""
    # 此处使用异或运算来简化代码
    # 异或规则为 0 ^ 0 = 1 ^ 1 = 0, 0 ^ 1 = 1 ^ 0 = 1
    if (nums[left] < nums[mid]) ^ (nums[left] < nums[right]):
        return left
    elif (nums[mid] < nums[left]) ^ (nums[mid] < nums[right]):
        return mid
    return right

def partition(nums: list[int], left: int, right: int) -> int:
    """哨兵划分（三数取中值）"""
    # 以 nums[left] 为基准数
    med = median_three(nums, left, (left + right) // 2, right)
    # 将中位数交换至数组最左端
    nums[left], nums[med] = nums[med], nums[left]
    # 以 nums[left] 为基准数
    i, j = left, right
    while i < j:
        while i < j and nums[j] >= nums[left]:
            j -= 1  # 从右向左找首个小于基准数的元素
        while i < j and nums[i] <= nums[left]:
            i += 1  # 从左向右找首个大于基准数的元素
        # 元素交换
        nums[i], nums[j] = nums[j], nums[i]
    # 将基准数交换至两子数组的分界线
    nums[i], nums[left] = nums[left], nums[i]
    return i  # 返回基准数的索引

def quick_sort(nums, left, right):
    if (left >= right): return
    pivot = partition(nums, left, right)
    quick_sort(nums, left, pivot - 1)
    quick_sort(nums, pivot + 1, right)

In [116]:
import random

nums = [random.randint(0, 10) for _ in range(10)]
print(nums)
quick_sort(nums, 0, len(nums) - 1)
print(nums)

[9, 1, 6, 0, 9, 7, 3, 3, 5, 8]
[0, 1, 3, 3, 5, 6, 7, 8, 9, 9]


In [113]:
def median_three(nums, left, mid, right):
    # NOTE: 使用异或简化条件判断
    if ((nums[left] < nums[mid]) ^ (nums[left] < nums[right])):
        return left
    if ((nums[right] < nums[mid]) ^ (nums[right] < nums[left])):
        return right
    return mid

def partition(nums, left, right):
    # NOTE: 相比于原始快排就是多了两步：找中值，交换到最左边
    med = median_three(nums, left, (left + right) // 2, right)
    nums[left], nums[med] = nums[med], nums[left]
    i, j = left, right
    while i < j:
        # NOTE: 如果 right 移动在前，则判断可以加 = 可以不加；否则不能加 =；第二个判断一定要加 = 
        while i < j and nums[j] > nums[left]:
            j -= 1
        while i < j and nums[i] <= nums[left]:
            i += 1
        
        nums[i], nums[j] = nums[j], nums[i]
    nums[i], nums[left] = nums[left], nums[i]
    return i

def quick_sort(nums, left, right):
    if (left >= right): return
    pivot = partition(nums, left, right)
    quick_sort(nums, left, pivot - 1)
    quick_sort(nums, pivot + 1, right)

### 尾递归优化

在某些输入下，快速排序可能占用空间较多。以完全有序的输入数组为例，设递归中的子数组长度为 m ，每轮哨兵划分操作都将产生长度为 0 的左子数组和长度为 m - 1 的右子数组，这意味着每一层递归调用减少的问题规模非常小（只减少一个元素），递归树的高度会达到 n - 1，此时需要占用 O(n) 大小的栈帧空间。

为了防止栈帧空间的累积，我们可以在每轮哨兵排序完成后，比较两个子数组的长度，仅对较短的子数组进行递归。由于较短子数组的长度不会超过 n / 2，因此这种方法能确保递归深度不超过 log n ，从而将最差空间复杂度优化至 O(logn) 。

In [117]:
def quick_sort(self, nums: list[int], left: int, right: int):
    """快速排序（尾递归优化）"""
    # 子数组长度为 1 时终止
    while left < right:
        # 哨兵划分操作
        pivot = self.partition(nums, left, right)
        # 对两个子数组中较短的那个执行快速排序
        if pivot - left < right - pivot:
            self.quick_sort(nums, left, pivot - 1)  # 递归排序左子数组
            left = pivot + 1  # 剩余未排序区间为 [pivot + 1, right]
        else:
            self.quick_sort(nums, pivot + 1, right)  # 递归排序右子数组
            right = pivot - 1  # 剩余未排序区间为 [left, pivot - 1]

###  快速选择

## 归并排序

「归并排序 merge sort」是一种基于分治策略的排序算法，包含 “划分” 和 “合并” 两个阶段。

1. 划分阶段：通过递归不断地将数组从中点处分开，将长数组的排序问题转换为短数组的排序问题。
2. 合并阶段：当子数组长度为 1 时终止划分，开始合并，持续地将左右两个较短的有序数组合并为一个较长的有序数组，直至结束。

稳定排序：在合并过程中，相等元素的次序保持不变。

对于链表，归并排序相较于其他排序算法具有显著优势，可以将链表排序任务的空间复杂度优化至 O(1)。

划分阶段：可以使用“迭代”替代“递归”来实现链表划分工作，从而省去递归使用的栈帧空间。
合并阶段：在链表中，节点增删操作仅需改变引用（指针）即可实现，因此合并阶段（将两个短有序链表合并为一个长有序链表）无须创建额外链表。

In [124]:
def merge(nums: list[int], left: int, mid: int, right: int):
    """合并左子数组和右子数组"""
    # 左子数组区间 [left, mid], 右子数组区间 [mid+1, right]
    # 创建一个临时数组 tmp ，用于存放合并后的结果
    tmp = [0] * (right - left + 1)
    # 初始化左子数组和右子数组的起始索引
    i, j, k = left, mid + 1, 0
    # 当左右子数组都还有元素时，比较并将较小的元素复制到临时数组中
    while i <= mid and j <= right:
        if nums[i] <= nums[j]:
            tmp[k] = nums[i]
            i += 1
        else:
            tmp[k] = nums[j]
            j += 1
        k += 1
    # 将左子数组和右子数组的剩余元素复制到临时数组中
    while i <= mid:
        tmp[k] = nums[i]
        i += 1
        k += 1
    while j <= right:
        tmp[k] = nums[j]
        j += 1
        k += 1
    # 将临时数组 tmp 中的元素复制回原数组 nums 的对应区间
    for k in range(0, len(tmp)):
        nums[left + k] = tmp[k]

def merge_sort(nums: list[int], left: int, right: int):
    """归并排序"""
    # 终止条件
    if left >= right:
        return  # 当子数组长度为 1 时终止递归
    # 划分阶段
    mid = (left + right) // 2  # 计算中点
    merge_sort(nums, left, mid)  # 递归左子数组
    merge_sort(nums, mid + 1, right)  # 递归右子数组
    # 合并阶段
    merge(nums, left, mid, right)

In [132]:
nums = [random.randint(0, 10) for _ in range(10)]
print(nums)
merge_sort(nums, 0, len(nums) - 1)
print(nums)

[9, 5, 2, 9, 3, 4, 1, 1, 8, 8]
[1, 1, 2, 3, 4, 5, 8, 8, 9, 9]
