使用 Python 随机生成三组长度递增的随机数列，长度分别为100、1000、10000，对生成的随机数组使用不同的排序算法，例如选择排序和归并排序，至少三种排序方法。对这些数列的数据排序，并分析不同排序算法在不同长度数列下的运行效果，例如运行时间等指标。（可以使用排序函数）

In [6]:
import random
import time
import pandas as pd

# 定义选择排序
def selection_sort(arr):
    for i in range(len(arr)):
        min_idx = i
        for j in range(i + 1, len(arr)):
            if arr[j] < arr[min_idx]:
                min_idx = j
        arr[i], arr[min_idx] = arr[min_idx], arr[i]
    return arr

# 定义归并排序
def merge_sort(arr):
    if len(arr) > 1:
        mid = len(arr) // 2
        L = arr[:mid]
        R = arr[mid:]
        merge_sort(L)
        merge_sort(R)
        i = j = k = 0
        while i < len(L) and j < len(R):
            if L[i] < R[j]:
                arr[k] = L[i]
                i += 1
            else:
                arr[k] = R[j]
                j += 1
            k += 1
        while i < len(L):
            arr[k] = L[i]
            i += 1
            k += 1
        while j < len(R):
            arr[k] = R[j]
            j += 1
            k += 1
    return arr

# 定义插入排序
def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
    return arr

# 定义快速排序
def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

# 定义排序测试函数
def test_sorting_algorithms(arr):
    # 使用四种排序算法
    sorting_algorithms = {
        "Selection Sort": selection_sort,
        "Merge Sort": merge_sort,
        "Insertion Sort": insertion_sort,
        "Quick Sort": quick_sort
    }
    
    results = {}
    
    for name, func in sorting_algorithms.items():
        arr_copy = arr.copy()
        start_time = time.time()
        func(arr_copy)
        end_time = time.time()
        results[name] = end_time - start_time
    
    return results

# 生成不同长度的随机数列
lengths = [100, 1000, 10000]
random_arrays = {length: [random.randint(0, 100000) for _ in range(length)] for length in lengths}

# 测试每个长度的数组在不同排序算法下的运行时间
all_results = {}
for length, arr in random_arrays.items():
    results = test_sorting_algorithms(arr)
    all_results[length] = results

# 展示结果
df_results = pd.DataFrame(all_results).T
print("Sorting Algorithm Performance Analysis (Selection, Merge, Insertion, Quick):")
print(df_results)


Sorting Algorithm Performance Analysis (Selection, Merge, Insertion, Quick):
       Selection Sort  Merge Sort  Insertion Sort  Quick Sort
100          0.000210    0.000169        0.000326    0.000129
1000         0.021907    0.001297        0.016285    0.000931
10000        1.319669    0.012630        1.431003    0.010217


### 总结分析
- 在小规模数据上，所有算法的差异不大，运行时间几乎相同。
- 随着数据规模的增加，选择排序和插入排序所花时间大幅度增加，归并排序和快速排序所花时间小幅度增加。
- 在大规模数据上，**归并排序**和**快速排序**明显更优。
- **选择排序**和**插入排序**适用于小规模数据的排序。
