## 冒泡排序 ##

属于最简单的直接暴力排序, 对长度为n的待排序队列进行$n - 1$次循环，每次循环找到待排序区间中的最大值并放到待排序队列最后。所有循环执行完毕后，整个队列就是最终的有序队列了。  

时间复杂度= $O(n^2)$。

### 步骤 ###

1. 对待排序数组 $nums_{[0,n]}$ 进行数对 $\{(i, i + 1) | i \in [0,n)\}$ 比较 , 如果 $nums_i > nums_{i + 1}$ 则进行前后交换
2. 一轮比较交换之后 $nums_n$ 就是本轮比较后输出的最大值
3. 缩小排序范围: $ n = n - 1$, 重复进行步骤[1,2,3]

In [None]:
def bubble_sort(nums):
    i = len(nums) - 1

    # 优化冒泡排序：如果在一轮冒泡中未发生过交换动作, 则说明整个待排序队列已经完全有序, 就可以直接提前结束整个排序
    stop = False

    while not stop and i:
        # 假设数列已经完成排序
        stop = True

        for k in range(0, i):
            # 数据大小顺序有误, 交换前后数据, 且需要继续下一轮冒泡
            if nums[k] > nums[k + 1]:
                nums[k], nums[k + 1] = nums[k + 1], nums[k]
                stop = False
        
        # 逐步缩小待排序范围
        i -= 1
    return nums

bubble_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 选择排序 ##

长度为n的待排序数列，进行 $n - 1$ 次选择, 每次选择剩余待排序区间中的最小值并放到区间开始位置。

时间复杂度= $O(n^2)$


In [None]:
def select_sort(nums):
    # 区间[0, n)中完成最小值选择排序
    for target in range(len(nums) - 1):
        # 维护待排序区间中的最小值所在位置
        min_key = target
        for j in range(target + 1, len(nums)):

            # 更新最小值位置
            if nums[j] < nums[min_key]:
                min_key = j
        
        # 将最小值插入到待排序区间开始位置
        if not target == min_key:
            nums[target], nums[min_key] = nums[min_key], nums[target]
    return nums

select_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 插入排序 ##

长度为n的待排序数列, 进行 $n - 1$ 次插入动作, 类似于玩扑克牌清理有序手牌的过程。

时间复杂度= $O(n^2)$

In [None]:
def insert_sort(nums):
    # 选取区间(0, n]的值作为待插入数值
    for i in range(1, len(nums)):
        # 记录本次将要插入的值
        target = nums[i]

        # 记录预比较数值位置
        pre_key = i - 1

        # 如果预比较数值大于待插入数值, 将预比较数值后移一位
        while pre_key >= 0 and nums[pre_key] > target:
            nums[pre_key + 1] = nums[pre_key]
            pre_key -= 1

        # 数值插入到正确位置
        nums[pre_key + 1] = target

    return nums

insert_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 快速排序 ##

通过一趟排序将待排记录分隔成独立的两部分，其中一部分记录的关键字均比另一部分的关键字小，则可分别对这两部分记录继续进行排序，以达到整个序列有序。

快速排序使用分治法（Divide and conquer）策略来把一个序列（list）分为两个子序列（sub-lists）。

1. 从数列中挑出一个元素，称为 “基准”（pivot），
2. 重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边）。在这个分区退出之后，该基准就处于数列的中间位置。这个称为分区（partition）操作。
3. 递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序。  

递归到最底部时，数列的大小是零或一，也就是已经排序好了。这个算法一定会结束，因为在每次的迭代（iteration）中，它至少会把一个元素摆到它最后的位置去。

In [None]:
def quick_sort(nums):
    # 递归完成快速排序
    partition(nums, 0, len(nums) - 1)
    return nums

def partition(nums, begin, end):
    # 递归终止条件
    if begin >= end:
        return

    # 取第一个数字作为基准值
    pivot = nums[begin]
    left, right = begin, end
    while left < right:
        # 从右往左找比基准值小的数字
        while left < right and nums[right] >= pivot:
            right -= 1
        # 移动较小数字到基准值左边位置
        if left < right:
            nums[left] = nums[right]
            left += 1
        # 从左往右找比基准值大的数字
        while left < right and nums[left] <= pivot:
            left += 1
        # 移动较大数字到基准值右边位置
        if left < right:
            nums[right] = nums[left]
            right -= 1
    # 移动基准值到两个大小分区中间的位置
    nums[left] = pivot
    
    # 分治排序基准值左侧区间和右侧区间
    partition(nums, begin, left - 1)
    partition(nums, left + 1, end)
    
quick_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 堆排序 ##

1. 构建大顶堆，得到最大值
2. 交换堆顶和堆尾，将最大值放到待排序空间最后，完成本轮排序
3. 缩减1个单位堆的范围, 继续步骤1（如果待排序范围长度等于1则终止整个排序，排序完成）

In [None]:
def max_heap(nums, start_idx, end_idx):
    # 默认最大值为左子节点: 2n + 1
    max_idx = (start_idx << 1) + 1
    while max_idx <= end_idx:
        # 如果右子节点的值更大, 更新最大值为右子节点
        if max_idx + 1 <= end_idx and nums[max_idx + 1] > nums[max_idx]:
            max_idx += 1
    
        if nums[max_idx] > nums[start_idx]:
            # 交换根节点和最大子节点的值, 使得根节点的值最大
            nums[max_idx], nums[start_idx] = nums[start_idx], nums[max_idx]

            # 迭代最大值的堆, 重构其大顶堆
            start_idx = max_idx

            # 默认新的最大值为最大值节点的左子节点
            max_idx = (start_idx << 1) + 1
        # 如果根节点的值更大, 大顶堆不需要调整
        else:
            return


def heap_sort(nums):
    # 最后一个数字nums[len - 1]一定是叶子节点(2n + 1)), 它的父节点[(i - 1) // 2]就是最后一个非叶子节点nums[((len - 1) - 1) // 2]
    # 从最后一个非叶子节点堆开始自底向上便利构造整个大顶堆(堆的根节点始终大于任何子节点)
    for i in range((len(nums) - 2) >> 1, -1, -1):
        max_heap(nums, i, len(nums) - 1)
    
    for i in range(len(nums) - 1, 0, -1):
        # 将大顶堆的堆顶(nums[0])与堆尾(nums[i])交换, 本轮排序得到待排序队列中的最大值
        nums[i], nums[0] = nums[0], nums[i]

        # 本轮最大值前面的区域(nums[0, i - 1])再次构造大顶堆, 获得新的最大值
        max_heap(nums, 0, i - 1)

    return nums
    

heap_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 桶排序 ##

将大规模的排序逻辑拆分为若干个小规模的排序, 再将局部排序结果拼接得到最终的整体排序结果。  

在存储条件允许的情况下, 尽可能多划分桶的数量, 来降低整体的排序时间复杂度。如果桶的数目划分过少, 而待排序数列分布不均衡, 可能会出现单桶排序高时间复杂度。

时间复杂度比较复杂, 在尽可能多的桶, 每个桶中的元素尽可能少的情况下时间复杂度能达到 $O(n)$

In [None]:
import math

def bucket_sort(nums):
    # 获取数列最大值、最小值
    max_val, min_val = -2**31, 2**31 - 1
    for n in nums:
        max_val = max(max_val, n)
        min_val = min(min_val, n)

    # 设置桶的数量为10
    bucket_size = 10

    # 计算每个桶的容量差距, 例如[0-9, 10-19, 20-29]三个桶
    bucket_gap = math.ceil((max_val - min_val) / (bucket_size - 1))

    # 初始化桶, 每个桶中的元素个数为0
    buckets = [[] for _ in range(bucket_size)]

    # 遍历所有待排序数, 减去最小值后除以桶的差距得到对应桶的下标, 根据下标放入桶中
    for n in nums:
        val = n - min_val
        # 数字按照规则放入对应桶中, 此时桶中的元素是无序的
        buckets[math.floor(val / bucket_gap)].append(val)

    # 每个桶进行小规模排序
    for b in buckets:
        b.sort()

    # 还原排序数列
    return [n + min_val for b in buckets for n in b]

bucket_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 计数排序 ##

桶排序思想, 利用数字本身作为桶, 桶中的值是统计数字重复出现的次数。最后按照桶的顺序，按照桶中统计的重复次数输出数字组成有序的数列。

由于桶中只对数字进行了计数, 所以排序本身是不稳定的。由于需要开辟整个数字区间的个数数量的桶，所以这个算法比较适合数列值的区间比较固定的场景。

排序方法的时间复杂度: $O(n)$

In [None]:
def count_sort(nums):
    # 得到数列中的两个最值
    max_num, min_num = -2 ** 31, 2 ** 31 - 1
    for n in nums:
        max_num = max(max_num, n)
        min_num = min(min_num, n)
    
    # 开辟与整个待排序数列涵盖区间一致数量的桶
    cnt = [0] * (max_num - min_num + 1)

    # 数列中数字对应的桶中的计数值累加
    for n in nums:
        cnt[n - min_num] += 1
    
    # 遍历桶, 并按照桶中的计数值还原排序数列
    nums = []
    for k, v in enumerate(cnt):
        for _ in range(v):
            nums.append(k + min_num)
    return nums


count_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])

## 基数排序 ##

是桶排序的一种实现, 使用基数作为桶, 根据不同的基数将数字放入不同的桶中来完成排序。

时间复杂度, 每个基数都会进行n次遍历, 总共有k个基数, 则最终的时间复杂度= $O(k*n)$

In [None]:
def radix_sort(nums):
    # 得到数列中的两个最值
    max_num, min_num = -2 ** 31, 2 ** 31 - 1
    for n in nums:
        max_num = max(max_num, n)
        min_num = min(min_num, n)
    
    # 数列中的数均减去最小值, 避免负数出现
    nums = [n - min_num for n in nums]

    # 最大值也需要减去最小值, 避免基数位数差异
    max_num -= min_num

    # 基数
    digit = 1
    while max_num:
        # 基数桶, 设置[0,9]10个基数桶
        cnt = [[] for _ in range(10)]

        # 依次将数字放入对应的基数桶中
        for n in nums:
            cnt[n // digit % 10].append(n)

        # 顺次从桶中取出得到本次排序后的最新序列
        nums = [j for i in cnt for j in i]

        # 基数倍数扩大
        digit *= 10
        max_num //= 10

    # 最终结果需要再次加上最小值来还原原数列
    return [n + min_num for n in nums]


radix_sort([3,5,10,6,4,8,34,-5,23,57,1,90,13,0,-10,99])
