# 排序算法-Python实现

In [1]:
import numpy as np

## 1. 冒泡排序

**冒泡排序（Bubble Sort）是一种交换排序，它的基本思想是：两两比较相邻记录的关键字，如果反序则交换，直到没有反序的记录为止。**

- 比较相邻的元素。如果第一个比第二个大（小），就交换他们两个；
- 对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对。这步做完后，最后的元素会是最大（小）的数；
- 针对所有的元素重复以上的步骤，除了最后一个；
- 持续每次对越来越少的元素重复上面的步骤，直到没有任何一对数字需要比较；

In [2]:
def bubble_sort(arr):
    for i in range(len(arr)-1, 0, -1):
        for j in range(i):
            if(arr[j] > arr[j+1]):
                arr[j], arr[j+1] = arr[j+1], arr[j]
    return arr

In [3]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = bubble_sort(arr)
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 42 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72
 74 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99]


**冒泡排序的优化：**避免不必要的比较。

In [4]:
def bubble_sort2(arr):
    flag = True
    for i in range(len(arr)-1, 0, -1):
        if(flag):
            flag = False
            for j in range(i):
                if(arr[j] > arr[j+1]):
                    arr[j], arr[j+1] = arr[j+1], arr[j]
                    flag = True
    return arr

In [5]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = bubble_sort2(arr)
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 42 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72
 74 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99]


## 2. 选择排序

**选择排序又称作简单选择排序（Simple Selection Sort）就是通过 n-i 次关键字之间的比较，从 n-i+1 个记录中选出关键字最小的记录，并和第 i（1⩽i⩽n）个记录交换。**  
选择排序的性能要略优于冒泡排序。  

- 首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置；
- 再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾；
- 重复第二步，直到所有元素均排序完毕；

In [6]:
def selection_sort(arr):
    for i in range(len(arr)):
        minindex = i
        for j in range(i+1, len(arr)):
            if(arr[minindex] > arr[j]):
                minindex = j
        if(minindex != i):
            arr[i], arr[minindex] = arr[minindex], arr[i]
    return arr

In [7]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = selection_sort(arr)
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 42 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72
 74 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99]


## 3. 插入排序

**插入排序又称作直接插入排序（Straight Insertion Sort）的基本操作是将一个记录插入到已排好序的有序列表中，从而得到一个新的、记录数增加1的有序表。**  
插入排序的性能要略优于选择排序。

- 将待排序序列的第一个元素看做一个有序序列，将第二个元素到最后一个元素当成是未排序序列；
- 从头到尾依次扫描未排序序列，将扫描到的每个元素插入有序序列的适当位置；
    - 如果待插入的元素与有序序列中的某个元素相等，则将待插入元素插入到相等元素的后面；

In [8]:
def insertion_sort(arr):
    for i in range(1, len(arr)):
        for j in range(i, 0, -1):
            if(arr[j] < arr[j-1]):  # 可以使用二分法快速定位，可以减少比较次数，但是对移动的次数没有帮助
                arr[j], arr[j-1] = arr[j-1], arr[j]
            else:
                break
    return arr

In [9]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = insertion_sort(arr)
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 42 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72
 74 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99]


## 4. 希尔排序

**希尔排序(Shell Sort)是插入排序的一种，又称缩小增量排序，它是针对直接插入排序算法的改进。它通过比较相距一定间隔的元素来进行，各趟比较所用的距离随着算法的进行而减小，直到只比较相邻元素的最后一趟排序为止。**  
希尔排序是把记录按下标的一定增量分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键词越来越多，当增量减至 1 时，整个文件恰被分成一组，算法便终止。

- 选择一个增量序列 t1，t2，...，tk，其中 ti > tj(j=i+1)，tk = 1；
- 按增量序列个数 k，对序列进行 k 趟排序；
    - 每趟排序，根据对应的增量 ti，将待排序列分割成若干长度为 m 的子序列，分别对各子表进行直接插入排序；
- 仅增量因子为 1 时，整个序列作为一个表来处理，表长度即为整个序列的长度；

In [66]:
# 希尔排序的特定增量序列 L 的实现
def shell_sort_customize(arr, L):
    for i in range(len(L)):  # 移除增量大于数组长度的增量值
        if(L[0] > len(arr)):
            arr.pop(0)
        else:
            break

    for gap in L:            # 每一个增量对应了一组子数组，对每一个子数组都要做插入排序
        for start in range(0, min(gap, len(arr)-gap-1)):  # 每一个子数组的第一个元素
            for i in range(start+gap, len(arr), gap):     # 每一个子数组都做插入排序
                for j in range(i, gap-1, -gap):
                    if(arr[j] < arr[j-gap]):
                        arr[j], arr[j-gap] = arr[j-gap], arr[j]
                    else:
                        break
    return arr

In [67]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = shell_sort_customize(arr, L=[40, 13, 4, 1])  # 使用Knuth序列
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 42 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72
 74 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99]


In [83]:
# 希尔排序的特定增量序列 L 的实现，减少一层循环
def shell_sort_customize2(arr, L):
    for i in range(len(L)):  # 移除增量大于数组长度的增量值
        if(L[0] > len(arr)):
            arr.pop(0)
        else:
            break

    for gap in L:            # 每一个增量对应了一组子数组，这一组子数组由于步长一致，可以一次性统一做插入排序
        for i in range(0, len(arr)-gap-1):
            for j in range(i+gap, gap-1, -gap):
                if(arr[j] < arr[j-gap]):
                    arr[j], arr[j-gap] = arr[j-gap], arr[j]
                else:
                    break
    return arr

In [84]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = shell_sort_customize2(arr, L=[40, 13, 4, 1])  # 使用Knuth序列
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72 74
 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99 42]


In [76]:
# 希尔排序的特定增量 base 的实现
def shell_sort2(arr, base):
    L, base0 = [1], base
    while(base <= len(arr)):
        L.insert(0, base)
        base *= base0
    return shell_sort(arr, L)

In [13]:
np.random.seed(0)
arr = np.random.randint(0, 100, 64)
print(arr)

arr = shell_sort2(arr, 3)
print(arr)

[44 47 64 67 67  9 83 21 36 87 70 88 88 12 58 65 39 87 46 88 81 37 25 77
 72  9 20 80 69 79 47 64 82 99 88 49 29 19 19 14 39 32 65  9 57 32 31 74
 23 35 75 55 28 34  0  0 36 53  5 38 17 79  4 42]
[ 0  0  4  5  9  9  9 12 14 17 19 19 20 21 23 25 28 29 31 32 32 34 35 36
 36 37 38 39 39 42 44 46 47 47 49 53 55 57 58 64 64 65 65 67 67 69 70 72
 74 75 77 79 79 80 81 82 83 87 87 88 88 88 88 99]
