# 排序
**多关键字排序**：可以通过数字组合成单关键字的排序  
**排序的稳定性**：关键字可能出现key1 == key2的情况，如排序前两关键字相等的记录的先后顺序和排序后没有发生变化，则称为**稳定排序**，否则为**不稳定排序**    
**内排序和外排序**：待排序的所有记录全部放置在内存中的排序为**内排序**，由于记录太多，不能同时放置在内存中，需要在内外存之间多次交换数据则称为**外排序**  

**内排序的算法性能影响因素**：
- **时间性能**：内排序主要进行两种操作：*比较*和*移动（交换）*
- **辅助空间**：指除了存放待排序所占用的存储空间之外，执行算法需要的其它存储空间
- **算法复杂度**：排序算法主要分为4类，7种：插入排序（直接插入排序、希尔排序）、交换排序（冒泡排序、快速排序）、选择排序（简单选择排序、堆排序）和归并排序。其中冒泡、简单选择、直接插入排序为简单算法，其余为复杂算法。

### 定义一个交换元素的方法，便于排序过程中调用

In [2]:
def swap(L, a, b):
    # L[a] = L[a] ^ L[b]
    # L[b] = L[a] ^ L[b]
    # L[a] = L[a] ^ L[b]
    temp = L[a]
    L[a] = L[b]
    L[b] = temp

## 一、 交换排序

## 1. 冒泡排序(Bubble Sort)
**基本思想**：两两比较相邻记录的关键字，如果反序则交换，直到没有反序的记录。**时间复杂度**O(n^2),稳定排序

In [4]:
def bubble_sort(L):
    i = 0
    length = len(L)
    flag = True # flag作为标识符
    while i < length - 1 and flag: # i遍历第一条记录递增至倒数第二条记录
        flag = False # 如果下面循环一直未交换，则flag = Flase，说明数组已有序，则退出i的循环
        j = length - 1
        while j > i: # j遍历最后一条记录递减至i的后一条记录
            if L[j] < L[j - 1]: # 如果前一条记录大于后一条记录，说明反序
                swap(L,j, j - 1) # 反序则交换两数
                flag = True # 发生交换则flag变为True
            j -= 1
        i += 1        

### 测试

In [5]:
L = list(range(10000))[::-1]
%time bubble_sort(L)

Wall time: 16.9 s


## 2. 快速排序

## 二、 选择排序

## 1. 简单选择排序(Simple Selection Sort)
**基本思想**：通过 n - i 次比较，从 n - i + 1个记录中选择出关键字最小的记录，并和第i个记录交换。（0 <= i < n)，**时间复杂度**O(n^2)，稳定排序  
<font color = red>注意</font>：简单选择排序最大的特点是交换移动数据次数变少，因此节约了相应时间，在性能上略优于冒泡排序

In [6]:
def simpleSelection_sort(L):
    length = len(L) 
    for i in range(length): 
        min = i
        j = i + 1
        while j < length: # 从 n - i + 1个记录中选择出关键字最小的记录
            if L[j] < L[min]:
                min = j 
            j += 1
        if min != i:
            swap(L, i, min)

In [7]:
L = list(range(10000))[::-1]
%time simpleSelection_sort(L)

Wall time: 4.98 s


## 2. 堆排序(Heap Sort)
**核心思想**：将待排序的序列构造成大顶堆，此时序列的最大值就是对顶的根结点。将它和堆的末尾元素交换，此时末尾元素就是最大值。然后对剩余的n - 1个元素的序列重新构造成堆，重复上述操作，最终可以得到一个有序序列。

### “堆”数据结构
堆是具有下列性质的完全二叉树：
1. 每个结点值都大于等于其左右孩结点的值，称为**大顶堆**，都小于等于的称为**小顶堆**
2. （完全二叉树的性质）约定最上层根结点编号从0开始，按层序遍历的方式，根结点i的左孩编号为2i+1,右孩编号为2i+2  

*堆可以用数组表示*

### 用当前序列构成“大顶堆”

In [18]:
def heapAdjust(root, length):
    while root < length:
        maxium = root
        left = root * 2 + 1
        right = root * 2 + 2
        if left < length:
            if L[left] > L[maxium]:
                maxium = left
        if right < length:
            if L[right] > L[maxium]:
                maxium = right
        if root != maxium:
            L[root] = L[root]^L[maxium]
            L[maxium] = L[root]^L[maxium]
            L[root] = L[root]^L[maxium]
        heapAdjust(maxium,length)

### 堆排序算法

In [None]:
def heap_sort(L):
    while len(L) > 1:
        length = len(L)
        heapAdjust(L[0],length)

In [None]:
        L[root] = L[root]^L[length - 1]
        L[length -1] = L[root]^L[length -1]
        L[root] = L[root]^L[length -1]

## 三、插入排序

## 1. 直接插入排序(Straight Insertion Sort)
**基本思想**：类似摸扑克牌时的是抓牌方法，每次将一个记录插入到已经排好序的有序表中。 时间复杂度O(n^2)，稳定排序  
<font color = red>注意</font>：它需要一个记录的辅助空间，平均性能略优于冒泡和简单选择排序

In [36]:
def straightInsertion_sort(L):
    length = len(L) 
    for i in range(length - 1):
        if L[i] > L[i + 1]:
            record = L[i + 1] # record用于记录待插入数
            j = i
            while L[j] > record and j >= 0: # 将待插入数左侧的大于待插入数的记录全部右移一个单位
                L[j + 1] = L[j]
                j -= 1
            L[j + 1] = record # 空出的位置插入record

In [35]:
L = list(range(10000))[::-1]
%time straightInsertion_sort(L)

Wall time: 7.7 s


## 补. 折半插入排序
**基本思想**：在直接插入排序的基础上，第i+1个数的插入过程并非从第i个数递减查找，而是通过折半（二分）查找实现。

## 2. 希尔排序（Shell Sort）
**基本思想**：  改进插入排序相邻数相比较的算法，采用变化的increment作为间隔，让相隔incremnet的记录组成子序列进行排序，再合成，通过变化的increment让序列越来越有序，最后increment减小为1，相当于对基本有序序列做直接插入排序，从而优化性能。时间复杂度O(^3/2)-O(n^2)，不稳定排序  
<font color = red>注意</font>：希尔排序的时间复杂度与increment的选取有关

In [11]:
def shell_sort(L):
    length = len(L)
    increment = length
    while increment > 1:
        increment = increment // 3 + 1 # 定义增量increment变化形式
        for i in range(increment, length): # 对第 0+increment个元素向后的元素进行间隔插入
            if L[i] < L[i - increment]: # 如果子序列反序，进行间隔直接插入排序
                record = L[i]                    ######################## 
                j = i - increment                ###                  ###
                 while L[j] > record and j >= 0: ### 间隔直接插入排序 ###
                    L[j + increment] = L[j]      ###                  ### 
                    j -= increment               ###                  ###
                L[j + increment] = record        ######################## 

In [14]:
L = list(range(10000))[::-1]
%time shell_sort(L) 

Wall time: 30.8 ms
