In [None]:
#设定计时器以直观化性能
import time
count=True
perf_start=0
perf_end=0
def timer():
    global count,perf_start,perf_end
    if count:
        perf_start = time.perf_counter()
        count=False
    else:
        perf_end = time.perf_counter()
        count=True
        print(f"总花费 {perf_end - perf_start:.6f}s")

numbers=[9,10,35,6,23,99,6,34,62,54,13,12,5,256]

# 排序

## 冒泡排序 (Bubble Sort)
- 时间复杂度： $O(n^2)$
- 通过不断的相邻交换完成排序

In [None]:
def bubble_sort(arr):
    """冒泡排序：O(n²)"""
    n = len(arr)
    # 遍历所有数组元素
    for i in range(n):
        # 最后i个元素已经排好序
        for j in range(0, n-i-1):
            # 如果当前元素大于下一个元素，交换它们
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
        #print(f"第{i+1}轮: {arr}")
    return arr

In [None]:
print("冒泡排序:")
timer()
bubble_sort(numbers.copy())
timer()

## 选择排序 (Selection Sort)
- 核心： 找未排序数据中的最小值/最大值，然后移至已排序数据的最后
- 时间复杂度：  $O(n^2)$ 

In [None]:
def selection_sort(arr):
    for i in range(len(arr)):#到第i项都已排序
        min_index = i

        for j in range(i+1,len(arr)): #未排序的数据
            if arr[j] < arr[min_index]:# 寻找最小值
                min_index = j
        
        arr[i],arr[min_index] = arr[min_index],arr[i]
        #print(f"第{i+1}次排序，最小元素 {arr[i]} 放到位置 {i}")
        #把最小值移动到已排序数据的最后面
    return arr



In [None]:
print("选择排序：")
timer()
print(selection_sort(numbers.copy()))
timer()

## 插入排序 (Insertion Sort)
- 核心思路： 取出单个数据，插入正确的位置
- 时间复杂度： $O(n^2)$ 
- 对于近有序的数据有很高的性能

In [None]:
def insertion_sort(arr):
    for i in range(1,len(arr)):
        ele = arr[i] #要插入的元素(抽出一张牌)
        j= i-1

        # 把比ele大的元素向右移动
        while j>=0 and ele < arr[j]:  #非第一项且比后一项大时：
            arr[j+1] =arr[j] # 向后移动
            j -= 1 # 下一步循环
        arr[j+1] = ele
        #print(f"插入 {ele}: {arr}")
    return arr


In [None]:
print("插入排序：")
timer()
print(insertion_sort(numbers))
timer()

## 快速排序 (Quick Sort)
- 核心：找一个基准，然后依次排序
- - 可以运用递归换基准
- 时间复杂度： 最坏 $O(n^2)$  (平均情况 $nlog_{}{n}$ )
- 性能均衡

In [None]:
def quick_sort(arr,inplace=False,low=0,high=None):
    from functools import partial
    l = len(arr)
    sort = partial(quick_sort,arr,True)
    
    def partition(arr,low,high):
        #先设定一个区分函数
        #arr[low-1]左边表示已排序好且较小的部分
        #arr[high]右边表示已排序好且较大的部分

        pivot = arr[high] #基准为数列最右端
        index = low-1 # 小边界的索引

        for j in range(low,high): # j在两个边界之间
            if arr[j] <= pivot: # 如果这一项比基准小/等于
                index += 1 # 较小部分添加一个元素
                arr[index],arr[j] = arr[j],arr[index] #小边界后一项(未排序)与这一项交换

        arr[index+1],arr[high] = arr[high],arr[index+1] 
        '''arr[high]是基准值。而在新的index之后的都比基准值大,
        故而交换使得进一步分离大小两部分：把基准值也算作小部分中'''
        return index+1 #返回小边界（从此项往后/右都比它要大）
     
    if inplace == False:
        if l<=1:
            return arr
        
        pivot = arr[l//2] #取中间的值作为标准

        left = [x for x in arr if x < pivot] #O(n) list 在arr中所有比基准值小的值
        middle = [x for x in arr if x == pivot] #O(n)
        right = [x for x in arr if x > pivot] #O(n)
        
        return quick_sort(left) + middle + quick_sort(right)
    # 一定要return，否则递归不成立，不会取调用栈！

    #原地排序,减少内存
    else:
        if high == None:
            high=l-1

        if low < high:
            #中间还有未排序的部分
            pi = partition(arr,low,high)

            #递归
            sort(low,pi-1)
            sort(pi+1,high)
            #arr[pi]就是在partition中的基准值，不需要再次排序



In [None]:
print(quick_sort(numbers.copy()))# 数据量过大可能会显示过回归RecursionError
copy_num = numbers.copy()
quick_sort(copy_num,True)
print(copy_num)

## 归并排序 (Merge Sort)
- 高效稳定
- 时间复杂度： $O(nlogn)$
- 核心： 递归拆分一个数组，根据两个数组之间每项的大小关系来排序
- 分治法 
    - 分： 拆分到最小单位(天然有序，最简单)
    - 治： 一步一步合成为更加复杂的结构
    - 通过小有序得到大有序，减弱了数据本身排列特点导致的时间不稳定性，如快速排序



In [None]:
def merge_sort(arr):
    '''功能：把一个数组拆分成两个，递归使用
    递归起始：若干个单列表
    递归末端：两个长而有序的列表合并
    '''
    if len(arr)==1:
        #递归的基状态：单数列，天然有序
        return arr
    else:
        mid = len(arr)//2
        left = merge_sort(arr[:mid])
        right = merge_sort(arr[mid:])#列表切片，左闭右开

        return merge(left,right) #返回有序的一个列表
    
def merge(left,right):
    #left & right 都是已经排好序(小->大)的列表
    result = [] #空的输出值
    i = j = 0   #储存当前已经记录的索引

    while i < len(left) and j < len(right):
        #当两个列表均没有被遍历完时
        if left[i] <= right[j]:
            result.append(left[i])
            i+=1
        else:
            result.append(right[j])
            j+=1
    #处理未计入的值
        #left已经遍历完了，现在推出while loop，但是right还剩有序的几个值
    result.extend(left[i:])
    result.extend(right[j:])
    
    return result

In [None]:
print("归并排序")
print(merge_sort(numbers.copy()))

## 堆排序 (Heap Sort)
- 核心： 利用完全树，实现`优先`的排序
- 时间复杂度： $O(nlogn)$

In [None]:
def heap_sort(arr):
    """堆排序：O(n log n)，原地排序"""
    n = len(arr)
    
    # 构建最大堆
    for i in range(n//2 - 1, -1, -1):
        heapify(arr, n, i)
    
    print(f"构建的最大堆: {arr}")
    
    # 逐个提取元素
    for i in range(n-1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i]  # 交换
        heapify(arr, i, 0)  # 对剩余元素堆化
        #print(f"第{n-i}次提取: {arr}")
    
    return arr

def heapify(arr, n, i):
    """维护最大堆属性"""
    largest = i
    left = 2 * i + 1
    right = 2 * i + 2
    
    if left < n and arr[left] > arr[largest]:
        largest = left
    
    if right < n and arr[right] > arr[largest]:
        largest = right
    
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]
        heapify(arr, n, largest)

print("\n堆排序过程:")
heap_sort(numbers.copy())

# 不同排序方法之间的比较
|场景	|推荐算法	|原因|
|------|----------|---|
|小数据量(n<50)	|插入排序 Insertion Sort	|实现简单，常数因子小|
|一般情况	|快速排序 Quick Sort	|平均性能最好|
|需要稳定排序|	归并排序 Merge Sort	|稳定且O(n log n)|
|数据几乎有序|	插入排序 Insertion Sort	|接近O(n)|
|内存有限|	堆排序 Heap Sort|	原地排序|