# 排序

动图演示：https://www.cnblogs.com/fivestudy/p/10064969.html


https://github.com/CyC2018/CS-Notes/blob/master/notes/%E7%AE%97%E6%B3%95%20-%20%E6%8E%92%E5%BA%8F.md

## 1. 冒泡排序

稳定排序法

最好的情况是只做$n-1$次比较，时间复杂度为$O(n)$，最坏情况需比较$\frac{n(n-1)}{2}$次，时间复杂度为$O(n^2)$。平均时间复杂度$O(n^2)$

只需一个额外空间，空间复杂度$O(1)$

In [29]:
def bubble_sort(data):
    for i in range(len(data)-1,-1,-1):
        # 设置flag，如果没有执行交换操作，表示排序完成，退出循环，
        # 提高运行效率
        flag = 0        
        # 一次循环后将最大的交换到后面，像冒泡一样
        for j in range(i):
            if data[j] > data[j+1]: 
                data[j], data[j+1] = data[j+1], data[j]
                flag += 1
#             print(data)
#         print(i, '='*28)
        if flag == 0:
            break

In [30]:
list_test = [6,1,2,7,9,3,4,5,10,8]
bubble_sort(list_test)
print(list_test)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


## 2. 选择排序

从数组中选择最小元素，将它与数组的第一个元素交换位置。再从数组剩下的元素中选择出最小的元素，将它与数组的第二个元素交换位置。不断进行这样的操作，直到将整个数组排序。

由于最大或者最小值直接与前方未排序的值交换，数据顺序很可能不是被改变，故是**不稳定排序法**

它的运行时间与输入排序无关，无论最佳、最坏、平均情况都需要比较$\frac{n(n-1)}{2}$次，时间复杂度为$O(n^2)$

只需一个额外空间，空间复杂度$O(1)$

In [21]:
def selection_sort1(data):
    for i in range(len(data)-1):
        for j in range(i+1,len(data)):
            if data[i] > data[j]:
                data[i], data[j] = data[j], data[i]
        print(data)
#         print(i, '='*28)

In [54]:
def selection_sort2(data):
    for i in range(len(data)-1):
        small = i
        for j in range(i+1,len(data)):
            if data[small] > data[j]:
                small = j
        # 每次循环只交换一次
        data[small], data[i] = data[i], data[small]
#         print(data)


In [55]:
list_test = [10,1,2,7,9,3,4,5,6,8]
selection_sort2(list_test)
print(list_test)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


## 3. 插入排序

适用于大部分数据已经过排序

每次都将当前元素插入到左侧已经排序的数组中

对于数组 [3, 5, 2, 4, 1]，它具有以下逆序：(3, 2), (3, 1), (5, 2), (5, 4), (5, 1), (2, 1), (4, 1)，插入排序每次只能交换相邻元素，令逆序数量减少 1，因此插入排序需要交换的**次数为逆序数量**。

稳定排序法

插入排序的时间复杂度取决于数组的初始顺序，如果数组已经部分有序了，那么逆序较少，需要的交换次数也就较少，时间复杂度较低。最好的情况是只做$n-1$次比较，时间复杂度为$O(n)$，最坏需比较$\frac{n(n-1)}{2}$次，时间复杂度为$O(n^2)$。平均时间复杂度$O(n^2)$

只需一个额外空间，空间复杂度$O(1)$

In [49]:
def insert_sort1(data):
    for i in range(1,len(data)):
        tmp = data[i]
        no = i
        while no-1 >= 0 and data[no-1] > tmp:
            data[no] = data[no-1]
            no -= 1
#             print(data)
        data[no] = tmp

In [50]:
list_test = [6,1,2,7,9,3,4,5,10,8]
insert_sort1(list_test)
print(list_test)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [51]:
def insert_sort2(data):
    for i in range(1,len(data)):
        tmp = data[i]
        no = i
        for j in range(i-1,-1,-1):
            if data[j] > tmp:
                data[j+1] = data[j]
                no = j
#                 print(data)
            else:
                break
        data[no] = tmp       

In [52]:
list_test = [6,1,2,7,9,3,4,5,10,8]
insert_sort2(list_test)
print(list_test)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


## 4. 希尔排序

希尔排序可以减少插入排序中数据搬运的次数。将数据区分成特定间隔的几个小区块，以插入排序法排完区块内的数据后再逐渐减少间隔的距离。当间隔为1时，就是插入排序。

稳定排序法

任何情况的时间复杂度均为$O(n^{\frac{3}{2}})$

只需一个额外空间，空间复杂度$O(1)$

In [59]:
def shell_sort(data):
    jump = len(data) // 2
    while jump != 0:
        for i in range(jump, len(data)):
            tmp = data[i]
            no = i
            # 插入排序
            while no-jump>=0 and data[no-jump] > tmp:
                data[no] = data[no - jump]
                no -= jump
            data[no] = tmp
        jump = jump // 2


In [58]:
list_test = [6,1,2,7,9,3,4,5,10,8]
shell_sort(list_test)
print(list_test)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


## 5. 归并排序

针对两个或两个以上排好序的数列，通过合并的方式组合一起

**2-way合并排序:**

将数列视为N个已经排好序且长度为1的数列，两两合并，结合成N/2个已经排好序且长度为2的数列；以同样的做法，再两两合并，最后合并成1个长度为N的数列。

稳定排序法

$n$项数据一般需要约$log_2n$次处理，每次处理的时间复杂度为$O(n)$，所以在任何情况下的时间复杂度均为$O(nlogn)$

在排序过程中需要一个和数列同样大小的额外空间，所空间复杂度$O(n)$

In [5]:
def merge(a, b):
    res = []
    i = j = 0
    while i < len(a) and j < len(b):
        if a[i] < b[j]:
            res.append(a[i])
            i += 1
        else:
            res.append(b[j])
            j += 1
#     return res+a[i:]+b[j:]
    if i == len(a):
        res.extend(b[j:])
    else:
        res.extend(a[i:])
    return res


def merge_sort(data):
    if len(data) <= 1:
        return data
    mid = len(data)//2
    left = merge_sort(data[:mid])
    right = merge_sort(data[mid:])
    return merge(left, right)


if __name__ == '__main__':
    a = [4, 7, 8, 3, 5, 9]
    print(merge_sort(a))

[3, 4, 5, 7, 8, 9]


两个已排序好的序列合并：

In [79]:
def merge_sort1(data):
    len_data = len(data)
    data1 = data[:len_data//2]
    data2 = data[len_data//2:]
    
    selection_sort2(data1)
    selection_sort2(data2)
    print(data1)
    print(data2)
    
    # 合并
    # 还有优化空间
    index1 = 0
    index2 = 0
    data3 = []
    while index1 < len(data1) and index2 < len(data2):
        if data1[index1] < data2[index2]:
            data3.append(data1[index1])
            index1 += 1
#             print('1:',index1)
        else:
            data3.append(data2[index2])
            index2 += 1
#             print('2:',index2)
    return data3 + data1[index1:] + data2[index2:]

In [76]:
# 虽然代码不简洁，但是减少了空间的利用
def merge_sort2(data):
    len_data = len(data)
    data1 = data[:len_data//2]
    data2 = data[len_data//2:]
    
    selection_sort2(data1)
    selection_sort2(data2)
    print(data1)
    print(data2)

    index1 = 0
    index2 = 0
    for i in range(len(data)):
        if data1[index1] < data2[index2]:
            data[i] = data1[index1]
            index1 += 1
            if index1 == len(data1):
                break
        else:
            data[i] = data2[index2]
            index2 += 1
            if index2 == len(data2):
                break
    if index1 != len(data1):
        for j in range(index1, len(data1)):
            data[index2+j] = data1[j]
    if index2 != len(data2):
        for j in range(index2, len(data2)):
            data[index1+j] = data2[j]

In [81]:
list_test = [6,2,7,9,3,4,5,10,8,1]
merge_sort1(list_test)
# print(list_test)

[2, 3, 6, 7, 9]
[1, 4, 5, 8, 10]


[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

## 6. 快速排序

相对来说最好的排序算法，运用了递归“分而治之”的思想

**不是稳定的排序算法**

在最快和平均情况下，时间复杂度为$O(nlogn)$，最坏的情况就是每次挑选的中间值不是最大就是最小，最坏情况下时间复杂度$O(n^2)$。

空间复杂度$O(nlogn)-O(n)$

In [5]:
def quick_sort1(data, low, high):
    if high > low:
        #传入参数，通过Partitions函数，获取k下标值
        left = low
        right = high
        #将最左侧的值赋值给参考值k
        k = data[low]
        #当left下标，小于right下标的情况下，此时判断二者移动是否相交，若未相交，则一直循环
        while left < right :
            # 当right对应的值大于k参考值，就一直向左移动
            while left < right and data[right] > k:
                right -= 1
            #当left对应的值小于k参考值，就一直向右移动
            while left < right and data[left] <= k:
                left += 1
            #若移动完，二者仍未相遇则交换下标对应的值
            data[left],data[right] = data[right],data[left]
            print(data, 'idx:',left, right)
        # left==right 若移动完，已经相遇，则交换right对应的值和参考值
        data[low], data[right] = data[right], k
        print(data)
        print('+' + '='*39 + '+')
        QuickSort(data,low,right-1)
        # 递归排序列表k下标右侧的列表
        QuickSort(data,right+1,high)

In [114]:
list_demo = [6,1,2,7,9,3,4,5,10,8]
s1 = time.time()
quick_sort1(list_demo,0,9)
e1 = time.time()
print(e1-s1)
#print(list_demo)

[6, 1, 2, 5, 9, 3, 4, 7, 10, 8] idx: 3 7
[6, 1, 2, 5, 4, 3, 9, 7, 10, 8] idx: 4 6
[6, 1, 2, 5, 4, 3, 9, 7, 10, 8] idx: 5 5
[3, 1, 2, 5, 4, 6, 9, 7, 10, 8]
[3, 1, 2, 5, 4, 6, 9, 7, 10, 8] idx: 2 2
[2, 1, 3, 5, 4, 6, 9, 7, 10, 8]
[2, 1, 3, 5, 4, 6, 9, 7, 10, 8] idx: 1 1
[1, 2, 3, 5, 4, 6, 9, 7, 10, 8]
[1, 2, 3, 5, 4, 6, 9, 7, 10, 8] idx: 4 4
[1, 2, 3, 4, 5, 6, 9, 7, 10, 8]
[1, 2, 3, 4, 5, 6, 9, 7, 8, 10] idx: 8 9
[1, 2, 3, 4, 5, 6, 9, 7, 8, 10] idx: 8 8
[1, 2, 3, 4, 5, 6, 8, 7, 9, 10]
[1, 2, 3, 4, 5, 6, 8, 7, 9, 10] idx: 7 7
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
0.002000093460083008


In [4]:
def quick_sort2(data):    
    """快速排序"""    
    if len(data) >= 2:  # 递归入口及出口        
        mid = data[len(data)//2]  # 选取基准值，也可以选取第一个或最后一个元素        
        left, right = [], []  # 定义基准值左右两侧的列表        
        data.remove(mid)  # 从原始数组中移除基准值        
        for num in data:            
            if num >= mid:                
                right.append(num)            
            else:                
                left.append(num)        
        return quick_sort(left) + [mid] + quick_sort(right)    
    else:        
        return data

In [130]:
list_test = [6,1,2,7,9,3,4,5,10,8]
s2 = time.time()
quick_sort2(list_test)
e2 = time.time()
print(e2-s2)
#print(list_test)

0.0


## 7. 堆积排序

不稳定的排序算法

在所有的情况下，时间复杂度为$O(nlog)$

只需要一个额外的空间，空间复杂度为$O(n)$

In [7]:
def heap_sort(data):
    for i in range(len(data)//2,0,-1):
        ad_heap(data,i,len(data)-1)
    for i in range(len(data)-2,0,-1):
        data[i+1], data[0] = data[0], data[i+1]
        ad_heap(data, 1, i)

def ad_heap(data, i, size):
    j = 2*i
    tmp = data[i]
    post = 0
    while j<=size and post==0:
        if j<size and data[j]<data[j+1]:
            j += 1
        if tmp >= data[j]:
            post = 1
        else:
            data[j//2] = data[j]
            j = 2*j
    data[j//2] = tmp


In [8]:
list_test = [6,1,2,7,9,3,4,5,10,8]
heap_sort(list_test)
print(list_test)

[9, 10, 7, 8, 3, 4, 5, 2, 1, 6]


## 8. 基数排序