# Chapter 9 排序

(1) 常见的排序算法：
    - 插入排序：
        - 直接插入排序
        - 希尔排序
    - 选择排序
        - 简单选择排序
        - 堆排序
    - 交换排序
        - 冒泡排序
        - 快速排序
    - 归并排序
    - 基数排序
    

(2) 排序的稳定性：  
    在排序状态下，假设排序前 $<r_i^\prime, r_j^\prime>$ 之间已有序 $<r_i, r_j>$，排序后该序关系不变，则称排序过程是稳定的。

----
## 插入排序

### 直接插入排序
    每轮将第 i 个元素插入到前 i - 1 个元素之中  
    循环不变量：前 i - 1 个元素是排好序的
- 插入准备：```x = R[i]```
- 找到插入位置
- 归位

In [35]:
def insertion_sort(arr): 
    # 原始模型
    for i in range(1, len(arr)):
        x = arr[i]
        j = i - 1
        while j >= 0 and x < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = x

arr = [3,5,4,2,1]
insertion_sort(arr)
print(arr)

[1, 2, 3, 4, 5]


算法分析：
- 稳定算法
- $T(n) \in O(n^2)$
- 比较次数：
  下界，$n - 1$，arr 数组已排好序  
  上界，$\Sigma_{i=1}^{n}i = \frac{1}{2}n^2$，arr 数组完全逆序  
  平均：$\Sigma_{i=1}^{n}\frac{1}{2}i = \frac{1}{4}n^2$
- 移动次数：  
  下界，$2(n - 1)$   
  上界，$2\Sigma_{i=1}^{n}i = n^2$  
  平均：$2\Sigma_{i=1}^{n}\frac{1}{2}i = \frac{1}{2}n^2$

### 改进算法：二分插入排序
    
    在寻找第 i 个插入位置时，采用二分策略，改善了比较，未改善移动

In [36]:
def bisect(arr, low, high, target):
    while low < high:
        mid = low + (high - low) // 2
        if arr[mid] > target:  # 找到比 target 大的第一个元素，为插入位置
            high = mid
        else:
            low = mid + 1
    return low

def insertion_sort_opt(arr):
    for i in range(1, len(arr)):
        x = arr[i]
        insert_idx = bisect(arr, 0, i, x)
        for j in range(i, insert_idx - 1, -1):
            arr[j] = arr[j - 1]
        arr[insert_idx] = x

        
arr = [3,5,4,2,1]
insertion_sort_opt(arr)
print(arr)

[1, 2, 3, 4, 5]


### 改进算法：二路插入排序

在二分排序的基础上进行改进，减少移动次数。需要借助额外辅助空间 ```D```。

- 选取一个轴心元素，e.i. ```R[0]```；  
- 以 ```D[0]``` 为依据，若 ```R[i] > D[0]```，在 ```R[:r + 1]``` 之间做二分插入排序，否则在 ```R[f:]``` 之间做二分插入排序；  
- 直到 ```R``` 的全部元素被插入 ```D```。

----
## 希尔排序：缩小增量法

将对原文件 F 的排序分为多个步骤

    (i) 每步取一个步长 d，将 F 视为逻辑上的 d 个文件；  
    (ii) 依据插入排序将 d 个文件分别进行排序；  
    (iii) 缩小 d 取值；  
    (iv) 重复进行 (ii) (iii) 直到 d = 1。
    
注：在步骤 (2) 中，采用插入排序原始模型，将原始模型中步长 1 改为 d 即可。

> 希尔排序难以把握 T(n)，且为不稳定排序算法

In [37]:
# def shell_sort(lists):    # 希尔排序
#     count = len(lists)
#     step = 2
#     group = count / step
#     while group > 0:
#         for i in range(0, group):
#             j = i + group
#             while j < count:
#                 k = j - group
#                 key = lists[j]
#                 while k >= 0:
#                     if lists[k] > key:
#                         lists[k + group] = lists[k]
#                         lists[k] = key
#                         k -= group
#                         j += group
#                         group /= step
#                         return lists             


----
## 冒泡排序

每趟冒泡，将最大/最小的元素向后/前推，经过 n - 1 趟冒泡，得到最终结果

In [58]:
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        flag = True
        for j in range(1, n - i):
            if arr[j] < arr[j - 1]:
                arr[j], arr[j - 1] = arr[j - 1], arr[j]
                flag = False
        if flag:
            return
                
                
arr = [3,5,4,1,2]
bubble_sort(arr)
print(arr)

[1, 2, 3, 4, 5]


----
## 堆排序

### 堆定义
- 堆：设 L 为长度为 n 的表，其元素满足 $L(i) <= L(2i), L(i) <= L(2i + 1)$  
- 称 $L(1)$ 为堆顶；  
- 特性：堆顶为全局最大/最小元素；  

In [39]:
from util.HeapPlayground import Heap
heap = Heap([9,8,7,6,5,4,3,2,1])
print(heap)

[1, 2, 3, 6, 5, 4, 7, 8, 9]


In [40]:
def _floatup(heap, pos):
    parentpos = (pos - 1) // 2
    while parentpos >= 0:
        if heap[pos] < heap[parentpos]:
            heap[pos], heap[parentpos] = heap[parentpos], heap[pos]
            pos, parentpos = parentpos, (parentpos - 1) // 2
            continue
        break
        
def _sinkdown(heap, pos, endpos):
    while pos <= (endpos - 1) // 2:
        leftchild, rightchild = pos * 2 + 1, pos * 2 + 2
        if rightchild > endpos or heap[leftchild] < heap[rightchild]:
            minchild = leftchild
        else:
            minchild = rightchild
        if heap[minchild] < heap[pos]:
            heap[minchild], heap[pos] = heap[pos], heap[minchild]
            pos = minchild
            continue
        break
        
def heappush(heap, item):
    heap.append(item)
    _floatup(heap, len(heap) - 1)
    
def heappop(heap):
    heap[0], heap[len(heap) - 1] = heap[len(heap) - 1], heap[0]
    value = heap.pop()
    _sinkdown(heap, 0, len(heap) - 1)
    
def heapify(heap):
    for pos in reversed(range(len(heap) // 2)):
        _sinkdown(heap, pos, len(heap) - 1)
        
def heapsort(arr):
    heapify(arr)
    for inplace in range(len(arr) - 1, 0, -1):
        endpos = inplace - 1
        arr[0], arr[inplace] = arr[inplace], arr[0]
        _sinkdown(arr, 0, endpos)
    arr.reverse()
    
arr = [9,8,7,6,5,4,3,2,1]
heapify(arr)
print("heapify:", arr)
heapsort(arr)
print("sorted:", arr)

heapify: [1, 2, 3, 6, 5, 4, 7, 8, 9]
sorted: [1, 2, 3, 4, 5, 6, 7, 8, 9]


----
## 合并排序

合并排序（或归并排序） -- 待排序文件已部分有序

（伪in-place）归并排序时间复杂度 $T(n) \in O(n^2logn)$  
由于存在递归调用，归并排序始无法以常数级时间开销解决排序。  

### 经典二路归并

比较次数：$O(nlogn)$  
移动次数：$O(n)$  
$T(n) \in O(nlogn)$  
辅助空间：$O(n)$  
运行栈开销：$O(logn)$  
$S(n) \in O(n)$   

In [59]:
# 二路归并，使用左闭右开区间，统一写法，减少bug

# 使用了左闭右开区间

def merge_sort(arr):
    wingman = copy(arr)
    low, high = 0, len(arr)
    _partition(arr, wingman, low, high)
    del wingman
    
def _ms_partition(arr, wingman, low, high):
    if high - low > 1:
        mid = low + (high - low) // 2
        _ms_partition(arr, wingman, low, mid)
        _ms_partition(arr, wingman, mid, high)
        _merge(arr, wingman, low, mid, high)
        
def _merge(arr, wingman, low, mid, high):
    i, j, k = low, mid, low
    while i < mid and j < high:
        if arr[i] < arr[j]:
            wingman[k] = arr[i]
            i += 1
        else:
            wingman[k] = arr[j]
            j += 1
        k += 1
    if i == mid:
        wingman[k:high] = arr[j:high]
    else:
        wingman[k:high] = arr[i:mid]
    arr[low: high] = wingman[low: high]
        

arr = [9,8,7,6,5,4,3,2,1]
merge_sort(arr)
print(arr)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


### 多路归并（败者树）

- 增大 $k$ 可以减少外存信息读写时间；
- 但 $k$ 个归并段中选取最小的记录需要比较 $k-1$ 次；
- 为得到 $u$ 个记录的一个有序段共需要 $(u-1)(k-1)$ 次比较；
- 若归并趟数为 $s$ 次，那么对 $n$ 个记录的文件进行外排时，内部归并过程中进行的总的比较次数为 $s(n-1)(k-1)$；
- 若共有 $m$ 个归并段，则 $s = log_km$；
- 所以总的比较次数为：$\lceil (log_km)(k-1)(n-1) \rceil = \lceil \frac{log_2m}{log_2k}(k-1)(n-1)\rceil$；
- 上式中 $\frac{k-1}{log_2k}$ 随 $k$ 增而增，因此内部归并时间随 $k$ 增长而增长了，抵消了外存读写减少的时间
- 由此引出了**败者树**：tree of loser。在内部归并过程中利用败者树将 $k$ 个归并段中选取最小记录比较的次数降为 $\lceil log_2k\rceil$ ，使总比较次数为 $\lceil log_2m(n-1)\rceil$，与 $k$ 无关。

####  败者树

> 败者食尘！

----
## 快速排序（分区交换排序）

- 在等待排序的 n 个元素中，选取任意一个 r，作为周新元素。  
- 以 r 为标准，将剩余 n - 1 个元素分为两组：
    - 所有元素都小于 r；  
    - 所有元素都大于等于 r。
- 将元素 r 置于两组元素之间。

称以上步骤为一趟快速排序。

**partition subsequence 描述**： 
1. 设置两个变量 i，j，排序开始的时候：i = 0，j = n，（左闭右开）；  
2. 以第一个元素作为关键数据，key = A[0]；  
3. 从 j 开始向前搜索，找到第一个小于 key 的值 A[j]，将 A[j] A[i] 互换；  
4. 从 i 开始向后搜索，找到第一个大于 key 的值 A[i]，将 A[j] A[i] 互换；  
5. 重复步骤 3，4，直到 i == j。
6. 此时 i 即为 partition point，将 pivot 赋给 A[i]，返回 i。


**此版本 quicksort 请使用全闭区间，不要用左闭右开区间，极为鬼畜**

In [69]:
# quicksort 全闭区间

def quick_sort(arr):
    low, high = 0, len(arr) - 1
    _quick_sort(arr, low, high)

def _quick_sort(arr, low, high):
    if not arr or low < 0:
        return
    if low < high:
        mid = _qs_partition(arr, low, high)
        _quick_sort(arr, low, mid - 1)
        _quick_sort(arr, mid + 1, high)

        
def _qs_partition(arr, low, high):
    pivot = arr[low]
    while low < high:
        while low < high and arr[high] >= pivot:
            high -= 1
        if low < high:
            arr[low] = arr[high]
            low += 1
        while low < high and arr[low] <= pivot:
            low += 1
        if low < high:
            arr[high] = arr[low]
            high -= 1
    arr[low] = pivot
    return low


arr = [9,8,7,6,5,4,3,2,1]
quick_sort(arr)
print(arr)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


### 注：左闭右开区间的优势

1. 需要取中间元素时，```mid = low + (high - low) // 2```。  
    如果区间元素的个数是奇数个，那么 mid 永远是指向中间的元素；  
    如果区间元素是偶数个，那么mid永远指向后半段区间的首元素；  
    这样做在二分查找等一些算法的实现上特别有优势。  

2. 方便迭代器快速的进行终止判别；  
    使用左闭右开的区间，迭代终止的条件是 ```low == high```。
    
3. 快速统计区间元素的个数，```n = high - low``` 即为元素的个数。

对于特殊情况，只有一个或者两个元素的区间（这一般发生在二分之类的算法快要终止的时候），也有更好的效果。

- 在 quick_sort 中，**不需要取中间元素**，**不需要统计区间个数**，判别迭代中止也不同于二分查找过程中的判别方式。使用左闭右开区间反而使得代码不清晰。

### 一个更简洁的快速排序

在寻找 pivot 位置的过程中，仅对小于 pivot 的值进行操作

**在 partition 过程中使用了for循环迭代，没有循环嵌套**

**采用了左闭右开区间**

In [75]:
# 使用左闭右开区间

def quick_sort(arr):
    low, high = 0, len(arr)
    _quick_sort(arr, low, high)

def _quick_sort(arr, low, high):
    if high - low > 1:
        mid = _partition2(arr, low, high)
        _quick_sort(arr, low, mid)
        _quick_sort(arr, mid + 1, high)

def _partition2(arr, low, high):
    pivot = arr[low]
    j = low
    for i in range(low + 1, high):
        if arr[i] < pivot: # 将所有小于 pivot 的元素从左侧堆砌
            j += 1
            arr[j], arr[i] = arr[i], arr[j]
    # 此时，arr[:j + 1] 都小于 pivot, arr[j + 1] 都大于 pivot
    # pivot 仍然为 arr[low]
    arr[low], arr[j] = arr[j], arr[low]
    return j


arr = [9,8,7,6,5,4,3,2,1]
quick_sort(arr)
print(arr)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


### 改进：三路快速排序



---- 
## 基数排序

