# 01. 各种排序算法

## 1.1 冒泡排序
冒泡排序多次遍历列表。它比较相邻的元素，将不合顺序的交换。每一轮遍历都将下一个最大值放到正确的位置上。本质上，每个元素通过“冒泡”找到自己所属的位置。

算法的时间复杂度是$O(n^2)$。

In [18]:
alist = [3,9,8,6,4,7,1,5,0,2]

def bubbleSort(alist):
    for i in range (len(alist)-1, 0, -1):
        for j in range(0, i):
            # print(j)
            if alist[j] > alist[j+1]:
                a = alist[j]
                alist[j] = alist[j+1]
                alist[j+1] = a
    return alist

bubbleSort(alist)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

冒泡排序通常被认为是效率最低的排序算法，因为在确定最终的位置前必须交换元素。“多余”的交换操作代价很大。不过，由于冒泡排序要遍历列表中未排序的部分，因此它具有其他排序算法没有的用途。特别是，如果在一轮遍历中没有发生元素交换，就可以确定列表已经有序。可以修改冒泡排序函数，使其在遇到这种情况时提前终止。对于只需要遍历几次的列表，冒泡排序可能有优势，因为它能判断出有序列表并终止排序过程。下面代码实现了如上所述的修改，这种排序通常被称作**短冒泡**。

In [19]:
alist = [3,9,8,6,4,7,1,5,0,2]

def bubbleSort(alist):
    for i in range (len(alist)-1, 0, -1):
        ex = False
        for j in range(0, i):
            # print(j)
            if alist[j] > alist[j+1]:
                a = alist[j]
                alist[j] = alist[j+1]
                alist[j+1] = a
                ex = True
        if ex==False:
            break
    return alist

bubbleSort(alist)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## 1.2 选择排序
选择排序在冒泡排序的基础上做了改进，每次遍历列表时只做一次交换。要实现这一点，选择排序在每次遍历时寻找最大值，并在遍历完之后将它放到正确位置上。和冒泡排序一样，第一次遍历后，最大的元素就位；第二次遍历后，第二大的元素就位，依此类推。若给n个元素排序，需要遍历n-1轮，这是因为最后一个元素要到n-1轮遍历后才就位。

算法的时间复杂度是$O(n^2)$。

In [29]:
alist = [3,9,8,6,4,7,1,5,0,2]

def selectionSort(alist):
    for i in range(len(alist)-1, 0, -1):
        max_pos = 0
        for j in range(0, i+1):
            if alist[max_pos] < alist[j]:
                max_pos = j
        # print('max pos: ', max_pos, ', i: ', i)
        t = alist[i]
        alist[i] = alist[max_pos]
        alist[max_pos]=t
    return alist

selectionSort(alist)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## 1.3 插入排序
插入排序的时间复杂度也是$O(n^2)$，但原理稍有不同。它在列表较低的一端维护一个有序的子列表，并逐个将每个新元素“插入”这个子列表。

In [31]:
alist = [3,9,8,6,4,7,1,5,0,2]

def insertionSort(alist):
    for index in range(1, len(alist)):
        currentvalue = alist[index]
        position = index
        
        while position > 0 and alist[position-1] > currentvalue:
            alist[position] = alist[position-1]
            position = position-1
        alist[position] = currentvalue
    return alist

insertionSort(alist)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## 1.4 希尔排序
希尔排序也称“递减增量排序”，它对插入排序做了改进，将列表分成数个子列表，并对每一个子列表应用插入排序。如何切分列表是希尔排序的关键——并不是连续切分，而是使用增量i（有时称作步长）选取所有间隔为i的元素组成子列表。

乍看之下，你可能会觉得希尔排序不可能比插入排序好，因为最后一步要做一次完整的插入排序。但实际上，列表已经由增量的插入排序做了预处理，所以最后一步插入排序不需要进行多次比较或移动。也就是说，每一轮遍历都生成了“更有序”的列表，这使得最后一步非常高效。

尽管对希尔排序的总体分析已经超出了本书的讨论范围，但是不妨了解一下它的时间复杂度。基于上述行为，希尔排序的时间复杂度大概介于$O(n)$和$O(n^2)$之间。通过改变增量i，比如采用$2^k-1 \ (1, 3, 7, 15, 31, …)$，希尔排序的时间复杂度可以达到$O(n^{\frac{3}{2}})$。

In [39]:
alist = [3,9,8,6,4,7,1,5,0,2]

def shellSort(alist):
    sublistcount = len(alist) // 2
    while sublistcount > 0:
        for startposition in range(sublistcount):
            gapInsertionSort(alist, startposition, sublistcount)
        sublistcount = sublistcount // 2
    return alist

def gapInsertionSort(alist, start, gap):
    print(alist, start, gap)
    for i in range(start+gap, len(alist), gap):
        print(alist[i], i)
        currentvalue = alist[i]
        position = i
        while position >= gap and alist[position-gap] > currentvalue:
            alist[position] = alist[position-gap]
            position = position-gap
        alist[position] = currentvalue

shellSort(alist)

[3, 9, 8, 6, 4, 7, 1, 5, 0, 2] 0 5
7 5
[3, 9, 8, 6, 4, 7, 1, 5, 0, 2] 1 5
1 6
[3, 1, 8, 6, 4, 7, 9, 5, 0, 2] 2 5
5 7
[3, 1, 5, 6, 4, 7, 9, 8, 0, 2] 3 5
0 8
[3, 1, 5, 0, 4, 7, 9, 8, 6, 2] 4 5
2 9
[3, 1, 5, 0, 2, 7, 9, 8, 6, 4] 0 2
5 2
2 4
9 6
6 8
[2, 1, 3, 0, 5, 7, 6, 8, 9, 4] 1 2
0 3
7 5
8 7
4 9
[2, 0, 3, 1, 5, 4, 6, 7, 9, 8] 0 1
0 1
3 2
1 3
5 4
4 5
6 6
7 7
9 8
8 9


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]