# 排序的基本概念和分类

## 基本概念
### 定义
排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。排序算法，就是如何使得记录按照要求排列的方法。

### 稳定性：
经过某种排序后，如果两个记录序号同等，且两者在原无序记录中的先后秩序依然保持不变，则称所使用的排序方法是稳定的，反之是不稳定的。

![title](img/排序算法.png)

### 内排序和外排序
内排序：排序过程中，待排序的所有记录全部放在内存中
外排序：排序过程中，使用到了外部存储。
通常讨论的都是内排序。

### 影响内排序算法性能的三个因素：
时间复杂度：即时间性能，高效率的排序算法应该是具有尽可能少的关键字比较次数和记录的移动次数
空间复杂度：主要是执行算法所需要的辅助空间，越少越好。
算法复杂性。主要是指代码的复杂性。

### 分类
根据排序过程中借助的主要操作，可把内排序分为：

- 插入排序
- 选择排序
- 交换排序
- 归并排序
- 分配排序

按照算法复杂度可分为两类：

- 简单算法：包括冒泡排序、简单选择排序和直接插入排序
- 改进算法：包括希尔排序、堆排序、归并排序和快速排序

|排序方法|平均情况|最好情况|最坏情况|辅助空间|稳定性|
|:---:|:---:|:---:|:---:|:---:|:---:|
|直接插入排序|$$O(n^2)\notag$$|$$O(n)\notag$$|$$O(n^2)\notag$$|$$O(1)\notag$$|稳定|
|希尔排序|$$O(n\log_2 n)\sim O(n^2)\notag$$|$$O(n^{1.3})\notag$$|$$O(n^2)\notag$$|$$O(1)\notag$$|不稳定|
|冒泡排序|$$O(n^2)\notag$$|$$O(n)\notag$$|$$O(n^2)\notag$$|$$O(1)\notag$$|稳定|
|快速排序|$$O(n\log_2n)\notag$$|$$O(n\log_2n)\notag$$|$$O(n^2)\notag$$|$$O(\log_2n)\sim O(n)\notag$$|不稳定|
|简单选择排序|$$O(n^2)\notag$$|$$O(n^2)\notag$$|$$O(n^2)\notag$$|$$O(1)\notag$$|不稳定|
|堆排序|$$O(n\log_2n)\notag$$|$$O(n\log_2n)\notag$$|$$O(n\log_2n)\notag$$|$$O(1)\notag$$|不稳定|
|归并排序|$$O(n\log_2n)\notag$$|$$O(n\log_2n)\notag$$|$$O(n\log_2n)\notag$$|$$O(n)\notag$$|稳定|
|基数排序|$$O(d(n+m))\notag$$|$$O(d(n+m))\notag$$|$$O(d(n+m))\notag$$|$$O(m)\notag$$|稳定|

# 插入排序 (Insertion Sort)

## 直接插入排序 (Straight Insertion Sort)
直接插入排序（Straight Insertion Sort）:时间复杂度$O(n^2)$

基本操作是将一个记录插入到已经排好序的有序表中，从而得到一个新的、记录数增1的有序表。

![title](img/InsertionSort-example.gif)

In [78]:
class SQList:
    def insert_sort(self, arr, is_print=False):
        nums = arr.copy()
        length = len(nums)
        # 下标从1开始
        for i in range(1, length):
            if nums[i] < nums[i-1]:
                temp = nums[i]
                j = i-1
                while nums[j] > temp and j >= 0:
                    nums[j+1] = nums[j]
                    j -= 1                    
                nums[j+1] = temp
                if is_print:
                    print(nums)
        return nums
    
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]    

In [73]:
%%timeit
sqnumst.insert_sort(nums)

3.65 µs ± 110 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [79]:
sorted_nums = sqnumst.insert_sort(nums, True)

[1, 4, 7, 3, 8, 5, 9, 2, 6]
[1, 3, 4, 7, 8, 5, 9, 2, 6]
[1, 3, 4, 5, 7, 8, 9, 2, 6]
[1, 2, 3, 4, 5, 7, 8, 9, 6]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


## 希尔排序 (Shell Sort)
希尔排序（Shell Sort）是插入排序的改进版本，其核心思想是将原数据集合分割成若干个子序列，然后再对子序列分别进行直接插入排序，使子序列基本有序，最后再对全体记录进行一次直接插入排序。

这里最关键的是跳跃和分割的策略，也就是我们要怎么分割数据，间隔多大的问题。通常将相距某个“增量”的记录组成一个子序列，这样才能保证在子序列内分别进行直接插入排序后得到的结果是基本有序而不是局部有序。下面的例子中通过：increment = int(increment/3)+1来确定“增量”的值。

希尔排序的时间复杂度为：$O(n^{\frac{3}{2}})$

In [98]:
class SQList:
    def shell_sort(self, arr, is_print=False):
        """希尔排序"""
        nums = arr.copy()
        length = len(nums)
        increment = len(nums)
        while increment > 1:
            increment = int(increment/3)+1
            for i in range(increment, length):
                if nums[i] < nums[i - increment]:
                    temp = nums[i]
                    j = i - increment
                    while j >= 0 and temp < nums[j]:
                        nums[j+increment] = nums[j]
                        j -= increment
                    nums[j+increment] = temp
                    if is_print:
                        print(nums)
        return nums
    
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]        

In [100]:
%%timeit
sqnumst.shell_sort(nums)

6.25 µs ± 115 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [99]:
sorted_nums = sqnumst.shell_sort(nums, True)

[4, 1, 7, 2, 8, 5, 9, 3, 6]
[4, 1, 7, 2, 6, 5, 9, 3, 8]
[4, 1, 6, 2, 7, 5, 9, 3, 8]
[4, 1, 6, 2, 7, 3, 9, 5, 8]
[4, 1, 6, 2, 7, 3, 8, 5, 9]
[1, 4, 6, 2, 7, 3, 8, 5, 9]
[1, 2, 4, 6, 7, 3, 8, 5, 9]
[1, 2, 3, 4, 6, 7, 8, 5, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


# 交换排序 (Exchange Sort)

## 冒泡排序 (Bubble sort)

冒泡排序（Bubble sort）：时间复杂度$O(n^2)$

交换排序的一种。

其核心思想是：两两比较相邻记录的关键字，如果反序则交换，直到没有反序记录为止。

还有两种优化方案。
- 优化1：某一趟遍历如果没有数据交换，则说明已经排好序了，因此不用再进行迭代了。用一个标记记录这个状态即可。
- 优化2：记录某次遍历时最后发生数据交换的位置，这个位置之后的数据显然已经有序，不用再排序了。因此通过记录最后发生数据交换的位置就可以确定下次循环的范围了。

In [115]:
class SQList:
    '''
    冒泡排序（升序排列）
    '''
    def bubble_sort(self, arr, is_print=False):
        """
        冒泡排序，时间复杂度O(n^2)
        """
        nums = arr.copy()
        length = len(nums)
        for i in range(length):
            # After each loop, a^(i)[i] = min{a^(i)[i:]},
            # where a^(i) is the array in the i-th loop
            j = length-2
            while j >= i:
                if nums[j] > nums[j+1]:
                    nums[j], nums[j+1] = nums[j+1], nums[j]
                    if is_print:
                        print(nums)
                j -= 1
        return nums
    
    def bubble_sort_advance(self, arr, is_print=False):
        """
        冒泡排序改进算法，时间复杂度O(n^2)
        设置flag，当一轮比较中未发生交换动作，则说明后面的元素其实已经有序排列了。
        对于比较规整的元素集合，可提高一定的排序效率。
        """
        nums = arr.copy()
        length = len(nums)
        exchange = length
        while exchange!=-1:
            bound = exchange-1
            exchange = -1
            for j in range(bound):
                if nums[j]>nums[j+1]:
                    nums[j], nums[j+1] = nums[j+1], nums[j]
                    exchange = j
                    if is_print:
                        print(nums)
        return nums    

sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]

In [65]:
%%timeit
sqnumst.bubble_sort(nums)

6.64 µs ± 136 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [66]:
sorted_nums = sqnumst.bubble_sort(nums, True)

[4, 1, 7, 3, 8, 5, 2, 9, 6]
[4, 1, 7, 3, 8, 2, 5, 9, 6]
[4, 1, 7, 3, 2, 8, 5, 9, 6]
[4, 1, 7, 2, 3, 8, 5, 9, 6]
[4, 1, 2, 7, 3, 8, 5, 9, 6]
[1, 4, 2, 7, 3, 8, 5, 9, 6]
[1, 4, 2, 7, 3, 8, 5, 6, 9]
[1, 4, 2, 7, 3, 5, 8, 6, 9]
[1, 4, 2, 3, 7, 5, 8, 6, 9]
[1, 2, 4, 3, 7, 5, 8, 6, 9]
[1, 2, 4, 3, 7, 5, 6, 8, 9]
[1, 2, 4, 3, 5, 7, 6, 8, 9]
[1, 2, 3, 4, 5, 7, 6, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [117]:
%%timeit
sqnumst.bubble_sort_advance(nums)

3.74 µs ± 152 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [116]:
sorted_nums = sqnumst.bubble_sort_advance(nums, True)

[1, 4, 7, 3, 8, 5, 9, 2, 6]
[1, 4, 3, 7, 8, 5, 9, 2, 6]
[1, 4, 3, 7, 5, 8, 9, 2, 6]
[1, 4, 3, 7, 5, 8, 2, 9, 6]
[1, 4, 3, 7, 5, 8, 2, 6, 9]
[1, 3, 4, 7, 5, 8, 2, 6, 9]
[1, 3, 4, 5, 7, 8, 2, 6, 9]
[1, 3, 4, 5, 7, 2, 8, 6, 9]


## 快速排序 (Quick Sort)

快速排序通常明显比同为Ο(n log n)的其他算法更快，因此常被采用，而且快排采用了分治法的思想，所以在很多笔试面试中能经常看到快排的影子。可见掌握快排的重要性。

步骤：

1. 从数列中挑出一个元素作为基准数。
2. 分区过程，将比基准数大的放到右边，小于或等于它的数都放到左边。
3. 再对左右区间递归执行第二步，直至各区间只有一个数。

![title](img/QuickSort-example.gif)

In [127]:
class SQList:
    def quick_sort(self, arr, is_print=False):
        """调用入口"""
        self.nums = arr.copy()
        self.is_print = is_print
        self.qsort(0, len(self.nums)-1)

    def qsort(self, low, high):
        """递归调用"""
        if low < high:
            pivot = self.partition(low, high)
            self.qsort(low, pivot-1)
            self.qsort(pivot+1, high)

    def partition(self, low, high):
        """
        快速排序的核心代码。
        其实就是将选取的pivot_key不断交换，将比它小的换到左边，将比它大的换到右边。
        它自己也在交换中不断变换自己的位置，直到完成所有的交换为止。
        但在函数调用的过程中，pivot_key的值始终不变。
        :param low:左边界下标
        :param high:右边界下标
        :return:分完左右区后pivot_key所在位置的下标
        """
        pivot_key = nums[low]
        while low < high:
            while low < high and self.nums[high] >= pivot_key:
                high -= 1
            if low<high:
                self.nums[low], self.nums[high] = self.nums[high], self.nums[low]
                if self.is_print:
                    print(self.nums)
            while low < high and self.nums[low] <= pivot_key:
                low += 1
            if low<high:
                self.nums[low], self.nums[high] = self.nums[high], self.nums[low]
                if self.is_print:
                    print(self.nums)            
        return low
    
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]    

In [130]:
%%timeit
sqnumst.quick_sort(nums)

9.02 µs ± 395 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [128]:
sorted_nums = sqnumst.quick_sort(nums, True)

[2, 1, 7, 3, 8, 5, 9, 4, 6]
[2, 1, 4, 3, 8, 5, 9, 7, 6]
[2, 1, 3, 4, 8, 5, 9, 7, 6]
[3, 1, 2, 4, 8, 5, 9, 7, 6]
[1, 3, 2, 4, 8, 5, 9, 7, 6]
[1, 3, 2, 4, 6, 5, 9, 7, 8]
[1, 3, 2, 4, 6, 5, 8, 7, 9]
[1, 3, 2, 4, 6, 5, 7, 8, 9]
[1, 3, 2, 4, 7, 5, 6, 8, 9]
[1, 3, 2, 4, 5, 7, 6, 8, 9]


# 选择排序 (Selection Sort)

## 简单选择排序 (simple selection sort)
简单选择排序（simple selection sort）:时间复杂度$O(n^2)$

通过$n-i$次关键字之间的比较，从$n-i+1$个记录中选出关键字最小的记录，并和第$i$（$1\leq i\leq n$)个记录进行交换。

通俗的说就是，对尚未完成排序的所有元素，从头到尾比一遍，记录下最小的那个元素的下标，也就是该元素的位置。再把该元素交换到当前遍历的最前面。其效率之处在于，每一轮中比较了很多次，但只交换一次。因此虽然它的时间复杂度也是$O(n^2)$，但比冒泡算法还是要好一点。

In [95]:
class SQList:
    def select_sort(self, arr, is_print=False):
        """
        简单选择排序，时间复杂度O(n^2)
        """
        nums = arr.copy()
        length = len(nums)
        for i in range(length):
            # After each loop, a^(i)[i] = min{a^(i)[i:]},
            # where a^(i) is the array in the i-th loop
            minimum = i
            
            # 1. Loop for [i+1,length) to find the smallest 
            # element and record its index
            for j in range(i+1, length):
                if nums[minimum] > nums[j]:
                    minimum = j
                    
            # 2. Swap the i-th element and the smallest element
            if i!=minimum:
                nums[minimum], nums[i] = nums[i], nums[minimum]
                
            if is_print:                
                print(nums)
        return nums     
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]

In [96]:
%%timeit
sqnumst.select_sort(nums)

6.35 µs ± 272 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [97]:
sorted_nums = sqnumst.select_sort(nums, True)

[1, 4, 7, 3, 8, 5, 9, 2, 6]
[1, 2, 7, 3, 8, 5, 9, 4, 6]
[1, 2, 3, 7, 8, 5, 9, 4, 6]
[1, 2, 3, 4, 8, 5, 9, 7, 6]
[1, 2, 3, 4, 5, 8, 9, 7, 6]
[1, 2, 3, 4, 5, 6, 9, 7, 8]
[1, 2, 3, 4, 5, 6, 7, 9, 8]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


## 堆排序 (Heap Sort)

堆排序在 top K 问题中使用比较频繁。堆排序是采用二叉堆的数据结构来实现的，虽然实质上还是一维数组。二叉堆是一个近似完全二叉树 。

二叉堆具有以下性质：

父节点的键值总是大于或等于（小于或等于）任何一个子节点的键值。
每个节点的左右子树都是一个二叉堆（都是最大堆或最小堆）。
步骤：

1. 构造最大堆（Build_Max_Heap）：若数组下标范围为0~n，考虑到单独一个元素是大根堆，则从下标n/2开始的元素均为大根堆。于是只要从n/2-1开始，向前依次构造大根堆，这样就能保证，构造到某个节点时，它的左右子树都已经是大根堆。

2. 堆排序（HeapSort）：由于堆是用数组模拟的。得到一个大根堆后，数组内部并不是有序的。因此需要将堆化数组有序化。思想是移除根节点，并做最大堆调整的递归运算。第一次将heap[0]与heap[n-1]交换，再对heap[0...n-2]做最大堆调整。第二次将heap[0]与heap[n-2]交换，再对heap[0...n-3]做最大堆调整。重复该操作直至heap[0]和heap[1]交换。由于每次都是将最大的数并入到后面的有序区间，故操作完后整个数组就是有序的了。

2. 最大堆调整（Max_Heapify）：该方法是提供给上述两个过程调用的。目的是将堆的末端子节点作调整，使得子节点永远小于父节点 。

![title](img/HeapSort-example.gif)

In [139]:
class SQList:
    def build_max_heap(self):
        # 将原始序列构造成一个大顶堆
        # 遍历从中间开始，到0结束，其实这些是堆的分支节点。
        i = int(self.length/2)       
        while i >= 0:
            self.heap_adjust(i, self.length-1)
            i -= 1
        
    def heap_sort(self, arr, is_print=False):
        self.nums = arr.copy()
        self.length = len(self.nums)
        
        # 1. Build max heap
        self.build_max_heap()
        if is_print:
            print(self.nums)
            
        # 2. Heap sort
        # 逆序遍历整个序列，不断取出根节点的值，完成实际的排序。
        j = self.length-1
        while j > 0:
            # 将当前根节点，也就是列表最开头，下标为0的值，交换到最后面j处
            self.nums[0], self.nums[j] = self.nums[j], self.nums[0]
            # 将发生变化的序列重新构造成大顶堆
            self.heap_adjust(0, j-1)
            j -= 1
            if is_print:
                print(self.nums)
        return self.nums
        
    def heap_adjust(self, s, m):
        """核心的大顶堆构造方法，维持序列的堆结构。"""
        temp = self.nums[s]
        # 当前结点为s,对应左、右子结点分别为2s+1、2s+2
        i = 2*s+1
        while i <= m:
            # i 指向较大的子节点
            if i < m and self.nums[i] < self.nums[i+1]:
                i += 1
                
            # 根节点大于子节点
            if temp >= self.nums[i]:
                break
            else:
                self.nums[s] = self.nums[i]
                s = i
                i = 2*i+1
        self.nums[s] = temp
        
sqnumst = SQList()
nums = [4,1,7,3,8,5,9,2,6]        

In [140]:
%%timeit
sqnumst.heap_sort(nums)

12.7 µs ± 592 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [138]:
sorted_nums = sqnumst.heap_sort(nums, True)

[9, 8, 7, 6, 1, 5, 4, 2, 3]
[8, 6, 7, 3, 1, 5, 4, 2, 9]
[7, 6, 5, 3, 1, 2, 4, 8, 9]
[6, 4, 5, 3, 1, 2, 7, 8, 9]
[5, 4, 2, 3, 1, 6, 7, 8, 9]
[4, 3, 2, 1, 5, 6, 7, 8, 9]
[3, 1, 2, 4, 5, 6, 7, 8, 9]
[2, 1, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


# 归并排序 (Merge Sort)

归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组，再合并数组。

先考虑合并两个有序数组，基本思路是比较两个数组的最前面的数，谁小就先取谁，取了后相应的指针就往后移一位。然后再比较，直至一个数组为空，最后把另一个数组的剩余部分复制过来即可。

再考虑递归分解，基本思路是将数组分解成left和right，如果这两个数组内部数据是有序的，那么就可以用上面合并数组的方法将这两个数组合并排序。如何让这两个数组内部是有序的？可以再二分，直至分解出的小组只含有一个元素时为止，此时认为该小组内部已有序。然后合并排序相邻二个小组即可。

![title](img/MergeSort-example.gif)

# 分配排序

## 桶排序

## 基数排序