## Sorting Algorithms

In [1]:
import numpy as np
import time

## Bubble Sort

In [2]:
def bubbleSort(array):
    '''
    冒泡排序是一种原地、稳定的排序算法，元素移动次数等于逆序度，时间复杂度最好为O(n)，最差为O(n^2)，空间复杂度为常数；
    冒泡排序会从头至尾扫描一遍数组，当前面的数大于后面的数时，会将二者交换，每次都将最大的数放置在最后，并且扫描区间稳定减少1；
    如果需要从大到小逆序排列，可从头到尾扫描时将最小的数放在末尾即可。
    '''
    for i in range(len(array)):
        for j in range(len(array)-i-1):
            if array[j] > array[j+1]:
                array[j], array[j+1] = array[j+1], array[j]
    return array

## Selection Sort

In [9]:
def selectionSort(array):
    '''
    选择排序是一种原地、不稳定的排序算法，所有的时间复杂度均为O(n^2)，空间复杂度为常数；
    选择排序会每次扫描一遍未排序区间，将其最小值与第一个值交换，以达到排序区间的长度+1；
    如果需要从大到小逆序排列，则每次选择最大值即可。
    '''
    for i in range(len(array)):
        minNum, minIndex = array[i], i
        for j in range(i, len(array)):
            if array[j] < minNum:
                minNum, minIndex = array[j], j
        array[i], array[minIndex] = array[minIndex], array[i]
    return array

### Insertion sort

In [25]:
def insertionSort(array):
    '''
    插入排序是一种原地、稳定的排序算法，元素移动次数等于逆序度，时间复杂度最好为O(n)，最差为O(n^2)，空间复杂度为常数；
    插入排序每次都将排序好的区间后一位元素加入排序好的区间；
    如果需要逆序排列，则改变插入时的判断条件即可。
    '''
    for i in range(1, len(array)):
        key = array[i]
        j = i - 1
        while j >= 0 and array[j] > key:
            array[j+1] = array[j]
            j = j - 1
        array[j+1] = key
    return array

In [3]:
## 检查算法正确性
Correctness = True
for i in range(100):
    array = np.random.randint(low=0, high=100, size=100)
    truth = sorted(array)
    result = insertionSort(array)
    correct = all(result == truth)
    if not correct:
        print('The algorithm is wrong')
        Correctness = False
if Correctness:
    print('The algorithm is right')

The algorithm is right


### Merge sort

In [4]:
def mergeSort(array):
    '''
    归并排序是一种非原地、稳定的排序算法，所有时间复杂度均为O(nlogn)，空间复杂度为O(n)
    '''
    if len(array) == 1:
        return array
    mid = len(array) // 2
    firstHalf = mergeSort(array[:mid])
    secondHalf = mergeSort(array[mid:])
    result = mergeCombine(firstHalf, secondHalf)
    
    return result

def mergeCombine(a1, a2):
    '''
    归并排序的合并算法，将两个排好序的序列合并成一个序列，时间复杂度为O(m+n)，空间复杂度为O(m+n)，m、n分别为a1、a2的数组长度
    '''
    i, j = 0, 0
    res = []
    while i <= len(a1)-1 or j <= len(a2)-1:
        if j >= len(a2):
            res.append(a1[i])
            i += 1
        elif i >= len(a1):
            res.append(a2[j])
            j += 1
        else:
            if a1[i] <= a2[j]:
                res.append(a1[i])
                i += 1
            else:
                res.append(a2[j])
                j += 1
    
    return res

In [5]:
## 检查算法正确性
Correctness = True
for i in range(100):
    array = np.random.randint(low=0, high=100, size=100)
    truth = sorted(array)
    result = mergeSort(array)
    correct = result == truth
    if not correct:
        print('The algorithm is wrong')
        Correctness = False
if Correctness:
    print('The algorithm is right')

The algorithm is right


### 时间开销对比

In [6]:
def insertionSortRunningTime(n):
    start = time.time()
    for i in range(100):
        array = np.random.randint(low=0, high=100, size=n)
        result = insertionSort(array)
    end = time.time()
    return end-start

def mergeSortRunningTime(n):
    start = time.time()
    for i in range(100):
        array = np.random.randint(low=0, high=100, size=n)
        result = mergeSort(array)
    end = time.time()
    return end-start

In [7]:
for n in [10, 50, 100, 500, 1000]:
    print('给大小为{}的数组排序，插入排序时间为：{}s，归并排序时间为：{}s'.format(n, round(insertionSortRunningTime(n), 4), \
                                                                                    round(mergeSortRunningTime(n), 4)))

给大小为10的数组排序，插入排序时间为：0.0s，归并排序时间为：0.0156s
给大小为50的数组排序，插入排序时间为：0.0156s，归并排序时间为：0.0156s
给大小为100的数组排序，插入排序时间为：0.1003s，归并排序时间为：0.0534s
给大小为500的数组排序，插入排序时间为：1.994s，归并排序时间为：0.2905s
给大小为1000的数组排序，插入排序时间为：8.0958s，归并排序时间为：0.4709s
