# 排序算法
学习链接：https://mp.weixin.qq.com/s/TBqLCgivhW0NerR_KzZaNQ

## 冒泡排序
冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢 “浮” 到数列的顶端。

![image.png](attachment:image.png)

In [3]:
class Sort:
    def __init__(self):
        pass
    
    ### 冒泡排序
    def sortingAlgorithm(self, nums):
        for i in range(len(nums)-1, -1, -1):
            for j in range(0, i): # i之后的数已排序完成
                if nums[j] > nums[j+1]:
                    nums[j], nums[j+1] = nums[j+1], nums[j]

        return nums

s = Sort()
print(s.sortingAlgorithm([2,3,1,4,7,2.0,3,5,9,1]))

[1, 1, 2, 2.0, 3, 3, 4, 5, 7, 9]


- 复杂度

时间复杂度O(n2) 空间复杂度O(1)

- 稳定性

在相邻元素相等时，它们并不会交换位置，所以，冒泡排序是稳定排序。

- 适用场景

冒泡排序思路简单，代码也简单，特别适合小数据的排序。但是，由于算法复杂度较高，在数据量大的时候不适合使用。

- 代码优化

在数据完全有序的时候展现出最优时间复杂度，为 O (n)。其他情况下，几乎总是 O ( n^2 )。因此，算法在数据基本有序的情况下，性能最好。要使算法在最佳情况下有 O (n) 复杂度，需要做一些改进，增加一个 swap 的标志，当前一轮没有进行交换时，说明数组已经有序，没有必要再进行下一轮的循环了，直接退出

## 选择排序
选择排序是一种简单直观的排序算法，它也是一种交换排序算法，和冒泡排序有一定的相似度，可以认为选择排序是冒泡排序的一种改进

![image.png](attachment:image.png)

In [4]:
class Sort:
    def __init__(self):
        pass
    
    ### 选择排序
    def sortingAlgorithm(self, nums):
        min_idx = -1 # 保存最小值index

        for i in range(len(nums)):
            min_idx = i
            for j in range(i, len(nums)):
                if nums[j] < nums[min_idx]:
                    min_idx = j
            # 交换
            nums[i], nums[min_idx] = nums[min_idx], nums[i]

        return nums

s = Sort()
print(s.sortingAlgorithm( [5.0, 8, 5, 2, 9]))

[2, 5, 5.0, 8, 9]


- 复杂度

时间复杂度O(n2) 空间复杂度O(1)

- 稳定性

用数组实现的选择排序是不稳定的，用链表实现的选择排序是稳定的。不过，一般提到排序算法时，大家往往会默认是数组实现，所以选择排序是不稳定的。

- 适用场景

选择排序实现也比较简单，并且由于在各种情况下复杂度波动小，因此一般是优于冒泡排序的。在所有的完全交换排序中，选择排序也是比较不错的一种算法。但是，由于固有的 O (n^2) 复杂度，选择排序在海量数据面前显得力不从心。因此，它适用于简单数据排序。

## 插入排序
插入排序是一种简单直观的排序算法。它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。

![image.png](attachment:image.png)

In [None]:
class Sort:
    def __init__(self):
        pass
    
    ### 插入排序
    def sortingAlgorithm(self, nums):
        for i in range(1, len(nums)):
            pos = i
            while pos > 0 and nums[pos-1] > nums[pos]: # 持续向左移动直到找到自己的位置
                nums[pos], nums[pos-1] = nums[pos-1],  nums[pos]
                pos -= 1
        return nums

s = Sort()
print(s.sortingAlgorithm( [5.0, 8, 5, 2, 9]))

[2, 5.0, 5, 8, 9]


- 复杂度

时间复杂度O(n2) 空间复杂度O(1)

- 稳定性

由于只需要找到不大于当前数的位置而并不需要交换，因此，直接插入排序是稳定的排序方法。
- 适用场景

插入排序由于 O (n^2) 的复杂度，在数组较大的时候不适用。但是，在数据比较少的时候，是一个不错的选择，一般作为快速排序的扩充。例如，在 STL 的 sort 算法和 stdlib 的 qsort 算法中，都将插入排序作为快速排序的补充，用于少量元素的排序。又如，在 JDK 7 java.util.Arrays 所用的 sort 方法的实现中，当待排数组长度小于 47 时，会使用插入排序。 O (n^2) 复杂度，选择排序在海量数据面前显得力不从心。因此，它适用于简单数据排序。

## 归并排序
归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为 2 - 路归并。

![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [None]:
class Sort:
    def __init__(self):
        pass
    def merge(self, left, right):
        """合并两个有序数列"""
        result = []
        # 两个数列都有值
        while len(left) > 0 and len(right) > 0:
            # 左右两个数列第一个最小放前面
            if left[0] <= right[0]:
                result.append(left.pop(0))
            else:
                result.append(right.pop(0))
        # 只有一个数列中还有值，直接添加
        result += left
        result += right
        return result

    def merge_sort(self, arr):
        """归并排序"""
        if len(arr) == 1:
            return arr
        # 使用二分法将数列分两个
        mid = len(arr) // 2
        # 通过不断递归，将原始序列拆分成n个小序列
        left = self.merge_sort(arr[:mid])
        right = self.merge_sort(arr[mid:])
        return self.merge(left, right)

s = Sort()
print(s.merge_sort( [5.0, 8, 5, 2, 9]))

[2, 5.0, 5, 8, 9]


In [None]:
class Solution:
    mod = 1000000007
    def MergeSort(self, left: int, right: int, data: List[int], temp: List[int]) -> int:
         # 停止划分
        if left >= right:
            return 0
        # 取中间
        mid = int((left + right) / 2) 
        # 左右划分合并
        res = self.MergeSort(left, mid, data, temp) + self.MergeSort(mid + 1, right, data, temp) 
        # 防止溢出
        res %= self.mod 
        i, j = left, mid + 1
        for k in range(left, right+1):
            temp[k] = data[k]
        for k in range(left, right+1):
            if i == mid + 1:
                data[k] = temp[j]
                j += 1
            elif j == right + 1 or temp[i] <= temp[j]:
                data[k] = temp[i]
                i += 1
            # 左边比右边大，答案增加
            else: 
                data[k] = temp[j]
                j += 1
                # 统计逆序对
                res += mid - i + 1 
        return res % self.mod
            
    def InversePairs(self , data: List[int]) -> int:
        n = len(data)
        res = [0 for i in range(n)]
        return self.MergeSort(0, n - 1, data, res)


- 复杂度

时间复杂度O(nlogn) 空间复杂度O(n)

- 稳定性

因为我们在遇到相等的数据的时候必然是按顺序 “抄写” 到辅助数组上的，所以，归并排序同样是稳定算法。
- 适用场景

归并排序在数据量比较大的时候也有较为出色的表现（效率上），但是，其空间复杂度 O (n) 使得在数据量特别大的时候（例如，1 千万数据）几乎不可接受。而且，考虑到有的机器内存本身就比较小，因此，采用归并排序一定要注意。

## 快速排序
快速排序(quick sort)采用了分治的策略。由C. A. R. Hoare在1962年提出。它的基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

In [16]:
class Sort:
    def __init__(self):
        pass

    def quick_sort(self, alist, start, end):
        """快速排序"""
        if start >= end:  # 递归的退出条件
            return alist
        mid = alist[start]  # 设定起始的基准元素
        low = start  # low为序列左边在开始位置的由左向右移动的游标
        high = end  # high为序列右边末尾位置的由右向左移动的游标
        while low < high:
            # 如果low与high未重合，high(右边)指向的元素大于等于基准元素，则high向左移动
            while low < high and alist[high] >= mid:
                high -= 1
            alist[low] = alist[high]  # 走到此位置时high指向一个比基准元素小的元素,将high指向的元素放到low的位置上,此时high指向的位置空着,接下来移动low找到符合条件的元素放在此处
            # 如果low与high未重合，low指向的元素比基准元素小，则low向右移动
            while low < high and alist[low] < mid:
                low += 1
            alist[high] = alist[low]  # 此时low指向一个比基准元素大的元素,将low指向的元素放到high空着的位置上,此时low指向的位置空着,之后进行下一次循环,将high找到符合条件的元素填到此处

        # 退出循环后，low与high重合，此时所指位置为基准元素的正确位置,左边的元素都比基准元素小,右边的元素都比基准元素大
        alist[low] = mid  # 将基准元素放到该位置,
        # # 对基准元素左边的子序列进行快速排序
        alist = self.quick_sort(alist, start, low - 1)  # start :0  low -1 原基准元素靠左边一位
        # 对基准元素右边的子序列进行快速排序
        alist = self.quick_sort(alist, low + 1, end)  # low+1 : 原基准元素靠右一位  end: 最后

        return alist

s = Sort()
print(s.quick_sort([5.0, 8, 5, 2, 9], 0, 4))

[2, 5.0, 5, 8, 9]


- 复杂度

时间复杂度O(nlogn) 

空间复杂度递归调用：

1. 最优的情况下空间复杂度为：O(logn)；每一次都平分数组的情况

2. 最差的情况下空间复杂度为：O(n)；退化为冒泡排序的情况

- 稳定性

快速排序并不是稳定的。这是因为我们无法保证相等的数据按顺序被扫描到和按顺序存放。
- 适用场景

快速排序在大多数情况下都是适用的，尤其在数据量大的时候性能优越性更加明显。但是在必要的时候，需要考虑下优化以提高其在最坏情况下的性能。

- 归并排序和快速排序的时间复杂度都是 O(nlogn)，为什么说快速排序一般优于归并排序？

快速排序中效率的主要来源之一是引用位置，在引用位置中，计算机硬件经过优化，因此访问彼此相邻的内存位置往往比访问分散在整个内存中的内存位置更快。quicksort中的分区步骤通常具有很好的局部性，因为它访问前面和后面附近的连续数组元素。因此，快速排序往往比其他排序算法（如heapsort）执行得更好，尽管它通常执行大致相同数量的比较和交换，因为在heapsort的情况下，访问更加分散。

此外，quicksort通常比其他排序算法快得多，因为它在原地运行，而不需要创建任何辅助数组来保存临时值。与merge sort相比，这是一个巨大的优势，因为分配和释放辅助数组所需的时间是显而易见的。就地操作也提高了quicksort的位置。

使用链表时，这两个优点都不一定适用。由于链表单元通常分散在整个内存中，因此访问相邻的链表单元没有额外的局部性好处。因此，quicksort的一个巨大的性能优势被消耗殆尽。类似地，就地工作的好处不再适用，因为merge sort的链表算法不需要任何额外的辅助存储空间。

也就是说，快速排序在链接列表中仍然非常快。合并排序往往更快，因为它更均匀地将列表分成两半，并且每次执行合并所做的工作比执行分区步骤所做的工作更少。

## 堆排序

## 个人练习

In [None]:
### 归并排序

def merge_sort(l, r):
    if l>=r:
        return
    
    mid = (l+r)//2
    merge_sort(l, mid)
    merge_sort(mid+1, r)

    i, j = l, mid+1
    tmp[l:r+1] = nums[l:r+1]
    
    for k in range(l, r+1):
        if i > mid:
            nums[k] = tmp[j]
            j+=1
        elif j > r:
            nums[k] = tmp[i]
            i+=1
        else:
            if tmp[i] <= tmp[j]:
                nums[k] = tmp[i]
                i+=1
            else:
                nums[k] = tmp[j]
                j+=1

nums = [5.0, 8, 5, 2, 9]
tmp = [0]*len(nums)
merge_sort(0, len(nums)-1)
print(nums)

[2, 5.0, 5, 8, 9]


In [20]:
### 快速排序

def quick_sort(l, r):
    if l>=r:
        return
    
    mid = nums[l]

    i, j = l, r
    while i < j:
        while nums[j]>=mid and i<j:
            j -= 1
        nums[i] = nums[j]

        while nums[i]<mid and i<j:
            i += 1
        nums[j] = nums[i]
    nums[i] = mid

    quick_sort(l, i-1)
    quick_sort(i+1, r)

nums = [5.0, 8, 5, 2, 9]
# tmp = [0]*len(nums)
quick_sort(0, len(nums)-1)
print(nums)

[2, 5.0, 5, 8, 9]
