# 常用排序算法总结
- 主要介绍冒泡排序、选择排序、插入排序、希尔排序、归并排序、快速排序的思想，并且用python实现。
- 新添计数排序（桶排序）、基数排序和堆排序

In [1]:
# 生成随机数列
from random import randint
def generateRandomArray(n, min, max):
    arr = []
    arr = [randint(min, max) for x in range(n)]
    return arr

### 冒泡排序
- 冒泡排序要对一个列表多次重复遍历，比较相邻的两项并且交换排序错误的项。每遍历一次都会有一个最大项排在正确的位置。
- 冒泡排序常被认为是最低效的排序方法，但是因为它需要遍历整个未排好的部分，它可以做到一些大多数排序方法做不到的事情。尤其是如果在一次遍历排序过程中没有交换数据项，则可以直接判定列表已经排好，根据这点可以对冒泡排序进行改进，增加exchangeFlag判断。

In [2]:
def bubbleSort(alist):
    for i in range(len(alist)-1, 0, -1):
        exchangeFlag = False
        for j in range(i):
            if alist[j+1] < alist[j]:
                alist[j], alist[j+1] = alist[j+1], alist[j]
                exchangeFlag = True
        if exchangeFlag == False:
            break
    return alist

### 选择排序
- 选择排序提升了冒泡排序的性能，它每遍历一次列表只交换一次数据，即进行一次遍历时找到最大的项，完成遍历后再把它换到正确的位置。

In [3]:
def selectSort(alist):
    for i in range(len(alist)-1, 0, -1):
        maxIndex = i
        for j in range(i):
            if alist[j] > alist[maxIndex]:
                maxIndex = j
        alist[maxIndex], alist[i] = alist[i], alist[maxIndex]
    return alist

### 插入排序
插入排序的算法复杂度仍是$O(n^2)$，但是工作原理稍有不同：它总是保持一个位置靠前的已排好的子表，然后每一个新数据被“插入”到前面的子表里。

In [4]:
def insertSort(alist):
    for i in range(1, len(alist)):
        currentValue = alist[i]
        position = i
        while alist[position-1] > currentValue and position > 0:
            alist[position] = alist[position-1]
            position -= 1
        alist[position] = currentValue
    return alist

### 希尔排序
- 希尔排序有时又叫做“缩小间隔排序”，它以插入排序为基础，将原来要排序的列表划分成一些子列表，再对每一个子列表执行插入排序，从而实现对插入排序性能的改进。

In [5]:
def shellSort(alist):
    gap = len(alist) // 2
    while gap > 0:
        for i in range(gap):
            gapInsertSort(alist, i, gap)
        gap = gap // 2
    return alist

def gapInsertSort(alist, startpos, gap):
    for i in range(startpos+gap, len(alist), gap):
        currentValue = alist[i]
        position = i
        while alist[position-gap] > currentValue and position > startpos:
            alist[position] = alist[position-gap]
            position = position - gap
        alist[position] = currentValue
    return 

### 归并排序
- 归并排序是一种递归算法，它持续地将一个列表分成两半。如果列表为空或者只有一个元素，那么根据定义，它就被排序好了。如果列表里的元素超过一个就把列表拆分，然后分别对两个部分调用归并排序。一旦这两个部分被排序好了，然后就可以对这两部分数列进行归并。
- 归并思想：把两个排序好了的列表结合在一起组成一个单一的有序的新列表。

In [6]:
def merge(alist, blist):
    clist = list()
    a = b = 0
    while a < len(alist) and b < len(blist):
        if alist[a] < blist[b]:
            clist.append(alist[a])
            a += 1
        else:
            clist.append(blist[b])
            b += 1
    if a == len(alist):
        for item in blist[b:]:
            clist.append(item)
    else:
        for item in alist[a:]:
            clist.append(item)
    return clist

def mergeSort(alist):
    if len(alist) <= 1:
        return alist
    
    part = len(alist) // 2
    left = mergeSort(alist[:part])
    right = mergeSort(alist[part:])
    return merge(left, right)

### 快速排序
- 通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另一部分的所有数据要小，然后再按照此方法对这两部分数据分别进行快速排序，整个排序过程可以递归地进行，以此达到整个数据变成有序序列。

In [7]:
def partition(alist, left , right):
    key = alist[left]
    low = left
    high = right
    while low < high:
        while low < high and alist[high] >= key:
            high -= 1
        alist[low] = alist[high]
        while low < high and alist[low] <= key:
            low += 1
        alist[high] = alist[low]
        alist[low] = key
    return low

def quickSort(alist, left, right):
    if left < right:
        part = partition(alist, left, right)
        quickSort(alist, left, part-1)
        quickSort(alist, part+1, right)
    return alist

### 计数排序
- 对每一个输入元素a[i]，确定小于等于a[i]的元素个数。所以可以直接把a[i]放到它输出数组中的位置上。
- 算法步骤如下：
  - 找出待排序的数组中最大和最小的元素
  - 统计待排数组中每个元素item出现的次数，并存在clist数组中第item个位置上
  - 对clist中的所有计数累加，计算小于或等于每个元素的元素个数
  - 反向填充目标数组，将alist中每个元素放在blist对应的位置上

In [8]:
def countSort(alist, k): # k是数组alist中最大的元素
    # 数组alist长度
    a_len = len(alist)
    # 输出数组
    blist = [0 for i in range(a_len)]
    # 临时数组，最大下标为k
    clist = [0 for i in range(k+1)]
    
    # 在clist中统计每个元素出现的次数
    for i in range(a_len):
        clist[alist[i]] += 1
    # 统计每一个元素小于或者等于它的元素个数，从第1个开始
    for i in range(1, len(clist)):
        clist[i] += clist[i-1]
    # 遍历alist中每个元素，放到blist对应的位置上
    for i in range(a_len):
        # clist(alist[i])是小于或等于该元素的元素个数，在blist中下标应该要减1
        blist[clist[alist[i]] - 1] = alist[i]
        # 更新clist中的数量
        clist[alist[i]] -= 1
    
    return blist

### 堆排序
- 使用堆的方式来对数组进行排序
  - 将要进行排序的数据构造成一个最大堆
  - 选择该最大堆的根节点（最大值），与最下最右的叶子节点进行交换，并排除该叶子节点对剩下的堆重新构造成最大堆
  - 重复第二步直至最大堆长度为1，完成排序

In [28]:
from collections import deque

def heapSort(alist):
    aheap = deque(alist)
    aheap.appendleft(0)
    
    len_aheap = len(aheap)-1
    first_sort_count = len_aheap // 2
    
    for i in range(first_sort_count):
        heap_adjust(aheap, first_sort_count-i, len_aheap)
    
    for i in range(len_aheap-1):
        swap_params(aheap, 1, len_aheap-i)
        heap_adjust(aheap, 1, len_aheap-i-1)
    
    return [aheap[i] for i in range(1, len(aheap))]

def heap_adjust(aheap, start, end):
    temp = aheap[start]
    
    i = start
    j = 2 * i
    
    while j <= end:
        if j < end and aheap[j] < aheap[j+1]:
            j += 1
        if temp < aheap[j]:
            aheap[i] = aheap[j]
            i = j
            j = 2 * i
        else:
            break
    aheap[i] = temp
    return aheap

def swap_params(aheap, start, end):
    aheap[start], aheap[end] = aheap[end], aheap[start]
    return aheap

### 基数排序
- 对待排序的数组首先按照最低位进行排序，然后由低位向高位进行

In [36]:
def radixSort(alist, d):
    for i in range(d):
        s = [[] for _ in range(10)]
        for item in alist:
            s[item/(10**i)%10].append(item)
        res = [a for b in s for a in b]
    return res

In [37]:
if __name__ == "__main__":
    arr = generateRandomArray(10, 0, 50)
    print('原始列表: ')
    print(arr)
    print('\n')
    
    bubbleArr = bubbleSort(arr)
    print('冒泡排序结果: ')
    print(bubbleArr)
    print('\n')
    
    selectArr = selectSort(arr)
    print('选择排序结果: ')
    print(selectArr)
    print('\n')
    
    insertArr = insertSort(arr)
    print('插入排序结果: ')
    print(insertArr)
    print('\n')
    
    shellArr = shellSort(arr)
    print('希尔排序结果: ')
    print(shellArr)
    print('\n')
    
    mergeArr = mergeSort(arr)
    print('归并排序结果: ')
    print(mergeArr)
    print('\n')
    
    quickArr = quickSort(arr, 0, len(arr)-1)
    print('快速排序结果: ')
    print(quickArr)
    print('\n')
    
    countArr = countSort(arr, max(arr))
    print('计数排序结果: ')
    print(countArr)
    print('\n')
    
    heapArr = heapSort(arr)
    print('堆排序结果: ')
    print(heapArr)
    print('\n')
    
    radixArr = radixSort(arr, 2)
    print('基数排序结果: ')
    print(radixArr)
    print('\n')

原始列表: 
[6, 17, 29, 2, 26, 32, 31, 3, 3, 35]


冒泡排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


选择排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


插入排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


希尔排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


归并排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


快速排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


计数排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


堆排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]


基数排序结果: 
[2, 3, 3, 6, 17, 26, 29, 31, 32, 35]




### 参考资料
- [常用的排序算法总结](https://zhuanlan.zhihu.com/p/40695917)