# 问题和性质

## 排序问题的定义

对具有序关系 $\leq$的集合S，一个排序算法 $sort:S\rightarrow S$ 对 S 的任意元素序列 s，满足

$$s^{\prime}= sort(s),s^{\prime}\subseteq S$$

并且 $s^{\prime}$的任意2个元素 e 和 $e^{\prime}$ 满足：

$$loc_{s^{\prime}}(e)\leq loc_{s^{\prime}}(e^{\prime}) \Longleftrightarrow e\leq e^{\prime}$$

其中 $loc_{s^{\prime}}(e)$ 为 e 在序列 $s^{\prime}$ 里的位置。

**内排序与外排序**

1. 内排序：如果待排序的记录都保持在内存，称为内排序；

2. 针对外存(磁盘、磁带等)数据的排序工作称为外排序。

本章主要讨论内排序算法，其中的**归并排序算法**是大多数外排序算法的基础。

## 排序的操作、性质和评价

假设我们需要排序的是：$S = \{R_0,R_1,\cdots,R_{n-1}\}$，其中 $R_i$ 的关键码是 $K_i$，我们按照 关键码对元素进行排序。

**排序的基本操作：**

1. 比较关键码的操作，通过比较来确定数据记录的顺序；
2. 移动数据记录的操作，用于调整数据记录的位置 或 顺序。


**排序的时间复杂度和空间复杂度：**

1. 时间复杂度：理论研究，基于关键码的排序操作，任何排序算法的复杂度都不可能优于 $O(\log n\log n)$；

2. 空间复杂度：排序算法的空间复杂度，只要是关注在执行算法过程中所需要的临时辅助空间。

备注：在执行排序算法时，人们特别关注算法的空间复杂度是不是常量的。常量的开销说明，排序可以在原表里完成，只需要几个变量作为操作中的临时存储。具有这种性质的排序算法称为**原地排序算法**。

**排序算法的性质：**

1. 稳定性：对待排序的序列 S 中关键码相等的两个元素 $R_i,R_j$，在排序之后保持 $R_i,R_j$ 的前后顺序不变。就称这个算法是稳定的；

2. 适应性：如果一个排序算法对接近有序的序列工作地更快，时间复杂度更低，就称这种算法具有适应性。

## 排序算法的分类

把经典的排序算法按照基本操作方式或特点进行如下分类：
1. 插入排序；
2. 选择排序；
3. 交换排序；
4. 分配排序；
5. 归并排序；
6. 外部排序。

**记录结构**

在之后章节讨论各种排序算法时，使用的示例数据结构就是一个表。假定表中元素是下面定义的record类的对象：
```python
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
```

另外，我们假定key排序所需的 $>,<,\geq,\leq$ 都已经有定义。并且只考虑 $\leq$，即递增顺序排序问题。

# 简单排序算法

## 二分法

****
查找确定元素

In [26]:
def bi_search(lst,target):
    left = 0 
    right = len(lst)-1
    while left<=right:
        mid = left+(right-left>>1)
        if lst[mid] == target:
            return mid 
        elif lst[mid]<target:
            left = mid + 1
        else:
            right = mid - 1
    return -1 

In [27]:
lst = [1,3,5,7,9,20,22]
for i in range(0,len(lst),2):
    res = bi_search(lst,lst[i])
    print(res,i)

0 0
2 2
4 4
6 6


****
查找左侧边界

In [36]:
def bi_search_left(lst,target):
    left = 0
    right = len(lst)
    while left<right:
        mid = left + (right-left>>1)
        if lst[mid] == target:
            right = mid  
        elif lst[mid]<target:
            left = mid + 1
        else:
            right = mid 
    if lst[left]!=target:
        return -1
    return left

In [38]:
lst = [2,3,3,4,5,6]
for i in range(0,len(lst),2):
    res = bi_search_left(lst,lst[i])
    print(res,i)

0 0
1 2
4 4


In [40]:
res = bi_search_left(lst,1)
res

-1

****
寻找右侧边界

In [64]:
def bi_search_right(lst,target):
    left = 0
    right = len(lst)
    while left<right:
        mid = left + (right-left>>1)
        if lst[mid] == target:
            left = mid + 1 
        elif lst[mid]<target:
            left = mid + 1
        else:
            right = mid 
    if (left == len(lst) and lst[left-1]!=target) or (left == 0 and lst[left]!=target):
        return -1
    
    return left-1

In [65]:
lst = [2,3,3,4,5,6]
for i in [1,2,3,6,10]:
    res = bi_search_right(lst,i)
    print(res,i)

-1 1
0 2
2 3
5 6
-1 10


寻找不超过n的最大平方数：

In [24]:
def find_max_sqrt(n):# 等价于寻找右侧边界(必然存在)
    if n<0:
        return -1
    left = 0
    right = n+1
    while left<right:
        mid = left + (right-left>>1)
        if mid**2 == n:
            left = mid + 1 
        elif mid**2>n:
            right = mid 
        elif mid**2<n:
            left = mid + 1
    return left-1

In [25]:
for i in range(17):
    res = find_max_sqrt(i)
    print(res,i)

0 0
1 1
1 2
1 3
2 4
2 5
2 6
2 7
2 8
3 9
3 10
3 11
3 12
3 13
3 14
3 15
4 16


## 插入排序

对一个连续列表，如下图所示，左侧表示已经排序部分；右侧(包含d)代表未排序部分。插入排序就是：
1. 对于未排序部分，从左到右依次处理未排序元素，每次只考虑最左端的元素d;
2. 将元素d从列表中取出，这样列表里就多了一个空位；
3. 通过d与已排序部分从右往左挨个比较，如果比d大就向右平移1个单位；否则d就插入当下的空位；
4. 循环未排序部分，重复以上过程即完成排序。
<img src='picture\sort_1.png'>

In [5]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def insert_sort(lst):
    for i in range(1,len(lst)):# 默认第一个元素已经排好序
        x = lst[i]# 此处默认list长度>=2
        j = i
        while j>0 and lst[j-1].key>x.key: 
            lst[j] = lst[j-1] # 如果 j-1位置元素更大，就往后移
            j -= 1 
        lst[j] = x # 因为是基于lst原地修改的，所以不需要返回lst  

In [7]:
a = [3,5,2,8,10,8,66]
lst = [record(i,i) for i in a]
insert_sort(lst)
for j in lst:
    print(j.key)

2
3
5
8
8
10
66


**时间和空间复杂度**

空间复杂度：因为只用到了几个临时变量，所以复杂度是 $O(1)$。

**时间复杂度：**

外层循环：外层循环执行次数就是 n-1 次；

内层循环： 执行次数和实际情况有关。变量j的初始值从 1 逐渐增加到 n-1：

    a. 最坏情况是 lst[j-1].key>x.key 总是失败，也就是说，每次处理的元素比已经排序的所有部分小，这个元素就会移到最前面，执行次数就是 j，结合外层循环，插入算法总执行次数为：
$$1 + 2 + \cdots + (n-1) = n\times (n-1)/2 $$
    
    b. 最好情况是 被处理元素大于已排序部分，内层循环体不执行；

经过以上分析，可知：

1. 关键码比较次数：最少是 n-1(对应的是内层循环不执行)，最多是 $n\times (n-1)/2 $;

2. 记录移动次数：包括内层循环外面的2次(取放被处理元素),最少是 $2(n-1)$，最多是 $2(n-1) + n\times (n-1)/2$。

所以最坏情况的时间复杂度是 $O(n^2)$，最好情况是 $O(n)$,说明这个算法具有适应性；同时根据代码逻辑也可知算法具有稳定性。

平均意义下，时间复杂度是 $O(n^2)$。

**插入排序的变形**

在检索元素的插入位置，可以从原来的顺序检索变成二分法检索，原因在于前面的部分是排好序的，适合二分法；即便如此，找到位置后还是要顺序移动元素，这还是需要线性时间。

另外，二分法要注意稳定性，即遇到相同的关键码，要保证插入位置在其后面。

In [83]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def insert_sort(lst):   
    for i in range(1,len(lst)):# 默认第一个元素已经排好序
        x = lst[i]           
        left,right = 0,i-1
        while left<=right:
            midd = int((left+right)/2)
            y = lst[midd]
            if y.key<= x.key: 
                left = midd+1 # 保证稳定性，不影响原来元素的序
            else:
                right = midd-1 
        j = i-1
        while j>=left: # 进行数据记录的倒序移动
            lst[j+1] = lst[j]
            j -= 1
        lst[left] = x

In [84]:
a = [3,5,2,1,10,8,66,8]
lst = [record(i,i) for i in a]
insert_sort(lst)
for j in lst:
    print(j.key)

1
2
3
5
8
8
10
66


其他：
[ 对链表进行插入排序](https://leetcode-cn.com/problems/insertion-sort-list/submissions/)

## 选择排序

选择排序的基本思想：

1. 维护所有数据中最小的i个已排序序列；

2. 每次从剩余未排序部分中选取关键码最小的数据，将其放在已排序序列的后面，作为第i+1个已排序元素；

3. 以空序列作为最开始的已排序序列，循环执行上述步骤，直到未排序部分里只剩下1个未排序元素时(它必然是最大元素)，直接将其放在已排序序列的最后。

<img src='picture\sort_2.png'>

**直接选择排序**

当找到最小数据时，如何腾出已排序部分后面的位置？一种比较直接的做法是：将已排序部分后面的元素和最小元素进行交换。交换时可能会破坏算法的稳定性。原因如下：

1. 最小元素放在已排序部分后面，不会影响稳定性，因为最小元素肯定比之前的已排序部分都大；
2. 已排序部分后面的元素放到最小元素原来的位置，可能会越过关键码相同的元素，这样在下次选取以该关键码为最小值的元素时，就会选择被越过的关键码相同的元素，这就导致了算法的不稳定性。

如果想要保持稳定性，优化的方法在于：

    类似上面的插入排序，先取出最小元素，然后对未排序元素到最小元素之间的部分顺序移动，再将最小元素放在已排序部分的后面。

In [45]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def select_sort(lst):   
    for i in range(len(lst)-1):# 最后一个元素必然最大
        min_index = i
        for j in range(i+1,len(lst)):
            if lst[j].key<lst[min_index].key:
                min_index = j 

        if i != min_index:
            lst[min_index],lst[i] = lst[i],lst[min_index]

In [46]:
a = [3,5,2,1,10,8,66,8]
lst = [record(i,i) for i in a]
select_sort(lst)
for j in lst:
    print(j.key)

1
2
3
5
8
8
10
66


算法的空间复杂度是$O(1)$;

元素比较的次数是固定的，是$n\times (n-1)/2$；记录的次数取决于实际情况，在 0 到 $2\times (n-1)$。综合可知，平均时间复杂度和最坏时间复杂度都是 $O(n^2)$。

从时间复杂度也可以看出，直接选择排序算法的实际平均排序效率是低于插入排序算法，所以很少实际使用。

**提高选择的效率**

直接选择排序算法效率低的原因是，每个元素都要从头开始顺序比较，没有利用上一次排序时的“记忆”。优化的方法就是之前提到的原位排序算法(空间复杂度为常数)堆排序，做到了时间复杂度的理论最优值$O(n\log n)$。但是堆排序算法没有稳定性和适应性。

## 交换排序

交换排序的基本思路是：一个序列如果没有完全排序，说明里面存在**逆序对**。交换发现的逆序对，就能更靠近良好排序序列；通过不断减少序列中的逆序，最终可以得到排序序列。采用不同的**确定逆序方法和交换逆序方法**，可以得到不同的**交换排序方法**。

起泡排序便是其中一种。

**起泡排序**

起泡排序的步骤：

1. 从序列的第一个数据下标开始，每个元素从左往右依次与相邻元素进行比较，如果发现是逆序，就交换；
2. 反复进行上述步骤直到序列不存在逆序，即完全有序。

示例如下：
<img src='picture\sort_3.png'>

通过起泡排序的步骤，可知：

1. 每一遍检查可以把一个最大元素交换到位，一些较大元素可以右移一段，可能移动很远；

2. 从左到右比较，导致从右到左换位的小元素每次只左移一个单位，个别距离目标位置很远的元素，可能延误整个排序进度。

3. 在每一遍检查的过程中，表的末端积累的是越来越多排好序的大元素；每次扫描，这段元素增加一个，经过n-1次扫描一定可以完成排序；

4. 每做一遍扫描，扫描的范围可以缩短一项(末端的大元素)。

In [24]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def bubble_sort(lst):   
    a = 0 
    for i in range(len(lst)):
        a += 1
        for j in range(1,len(lst)-i):
            if lst[j].key<lst[j-1].key:
                lst[j],lst[j-1] = lst[j-1],lst[j]
    print('循环次数',a)

In [25]:
a = [3,5,2,1,10,8,66,8]
lst = [record(i,i) for i in a]
bubble_sort(lst)
for j in lst:
    print(j.key)


循环次数 8
1
2
3
5
8
8
10
66


**算法的改进**

只有在被排序表的最小元素在序列最末端，起泡排序才需要做满 n-1 遍。其他情况不需要这么多次，如果发现排序完成可以早点结束。

In [22]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def bubble_sort_v2(lst): 
    a = 0
    for i in range(len(lst)):
        a += 1 
        found = False
        for j in range(1,len(lst)-i):
            if lst[j].key<lst[j-1].key:
                lst[j],lst[j-1] = lst[j-1],lst[j]
                found = True
        if not found:
            break  
    print('循环次数',a)

In [23]:
a = [3,5,2,1,10,8,66,8]
lst = [record(i,i) for i in a]
bubble_sort_v2(lst)
for j in lst:
    print(j.key)

循环次数 4
1
2
3
5
8
8
10
66


这样做提高了效率，而且使得算法有了效率。

起泡排序的时间复杂度：$O(n^2)$；空间复杂度：$O(1)$

试验表明，起泡排序的实际效果劣于时间复杂度相同的插入排序，原因可能有二：

1. 排序过程中的赋值操作比较多，累积起来代价比较大；

2. 一些距离目标位置很远的小元素可能会拖累整个算法。

改善第2点，可以通过下一节要介绍的快速排序；另一种是交错起泡，具体做法是一遍从左到右扫描，下一遍从右到左，交错进行。如下图所示：

<img src='picture\sort_4.png'>

## 快速排序

快速排序是一种著名的排序算法，作为最早的采用递归方式描述的一种优美算法，展示了递归描述形式的威力。在各种基于关键码排序的内排序算法中，快速排序是实践中平均速度最快的算法之一。

快速排序实现中也采用了发现逆序和交换记录位置的的方法，但算法中最本质的思想是划分，即按某种标准把数据分为“大数据”和“小数据”，并通过递归不断划分，最终得到一个排序的序列。基本过程是：

1. 选择一种标准，把被排序序列中的记录按照这种标准分成大小两组。从整体看，这两组之间的相对顺序已定，较小一组的记录应该排在前面；

2. 采用1中的方式，递归地划分上述2组数据记录，并不断递归下去；

3. 递归划分使得每个数据块越来越小，直到每个小组中仅包含一个元素时，划分结束。排序工作完成。

快速排序有多种实现方法，下面主要介绍基于顺序表的实现。

### 快速排序的表实现

**划分标准和移动方式**

顺序表里数据不同的划分标准和移动方式定义了不同的快速排序算法。

* 移动方式：为了降低算法的空间复杂度，我们希望尽可能在原表内实现数据的移动。通过表内移动将数据分成两组，大的一组移动到表右边，小的一组移动到表左边，全部的递归完成时表中记录自然有序；


* 划分标准：现在考虑最简单的划分方式，取序列中第一个元素作为划分序列的元素，以其关键码来划分记录，将小于关键码的放在表的左边，大于关键码的放在表的右边。划分完成后表内小数据和大数据两组之间会留下一个空位，这就是作为比较标准的元素的正确位置，随后的操作中不需要改变它。


备注：

    上述的划分标准有时候可以导致排序的低效。有人提出“三者取中”的原则：每次划分前比较分段中的第一个、最后一个、位置居中的三个元素的关键码，取关键码居中的元素和第一个元素交换位置，而后基于这个首位置的关键码进行划分。这种做法可以减小最坏情况出现的概率。

**单次划分的实现**

现在考虑一段记录，初始状态如 (a) 所示：

   * 取出第一个元素 R，其关键码是 K，这时会留出一个空位。部分已经分好 $\leq R$的小数据排在序列的左侧；$\geq R$ 的大数据放在序列的右端。中间是未进行划分的数据。假设未划分部分序列的第一个和最后一个位置为 i (此时位置 i 存放的就是元素 R) 和 j。
   
1. 现在交替进行如下操作：

    1. 如图 b所示，从 j 开始从右向左寻找第一个关键码小于 K 的数据(j 不断减小)，找到后将其存入 i 所指的空位。此时，j 对应位置为空，i 增加 1 指向下一个待检查的记录；

    2. 如图 c 所示，从 i 开始从左向右寻找第一个关键码大于 K 的数据(i 不断增加)，找到后将其加入 上一轮结束时 j 所指的空位。此时，i对应位置为空， j 减小 1指向下一个待检查的记录；
   
   
2. 重复交替进行上述两套操作，直到 i 不再小于 j 为止( 2个操作里 j 不断减小， i 不断增加)。


3. 划分结束时 i和j相等，指向空位，将记录 R 存入空位。一次划分完成。

<img src='picture\sort_5.png'>

划分完成后，对两边的子序列按上述的同样方式递归处理。由于要执行两个递归，快速排序算法的执行形成了一种二叉树形式的递归调用。

### 程序实现

In [5]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def quick_sort(lst):
    qsort_rec(lst,0,len(lst)-1)

def qsort_rec(lst,l,r):
    if l>=r:
        return 
    i,j = l,r
    R = lst[i]
    while i<j:
        while i<j and lst[j].key>=R.key:
            j -= 1
        if i<j:
            lst[i] = lst[j]
            i += 1 
        while i<j and lst[i].key<=R.key:
            i += 1 
        if i<j:
            lst[j] = lst[i]
            j -= 1 
    lst[i] = R 
    qsort_rec(lst,l,i-1)
    qsort_rec(lst,i+1,r)

In [8]:
a = [100,3,5,2,1,10,8,66,8]
lst = [record(i,i) for i in a]
quick_sort(lst)
for j in lst:
    print(j.key)

1
2
3
5
8
8
10
66
100


**算法的复杂度**

上述排序的时间复杂度：

1. 当序列是完全逆序时，需要的时间复杂度是 $O(n^2)$；
2. 平均时间复杂度是 $O(n\log n)$。

抽象看，快速排序产生的划分结构，可以看做以枢轴记录为根，以两个划分分段递归划分的结果作为左右子树的一棵搜索二叉树。

空间复杂度：最坏是 $O(n^2)$,可以做到 $O(\log n)$

## 归并排序

### 定义

归并是一种典型的序列操作，把两个或者多个有序的序列合并在一起成为一个有序序列。基于归并的思想也可以实现排序，称为**归并排序**。基本方法如下：

1. 初始时把 待排序序列的 n 个元素看成 n 个有序子序列，每个子序列长度均为1；
2. 把当时序列组里的有序子序列两两归并，完成一遍后序列组里的排序子序列数量减半，每个子序列长度加倍；
3. 对加长的子序列重复步骤2，最终得到一个长度为n的有序序列。


这种归并排序成为**二路归并排序**，每次都是把2个有序子序列归并成1个。也可以考虑三路归并排序或者多路。

一个例子如下：
<img src='picture\sort_6.png'>

**归并排序的特点**

归并排序是一种顺序性操作，很适合处理存在磁盘等外存的大量数据。

### 算法实现

**算法使用的空间**

之前的算法会考虑原地存储的情况，归并排序要实现原地存储有点复杂，替代性解决方案就是开辟一个和原表同样大小的存储空间，将每次归并排序后的结果存储进去；

一遍归并排序完成后，原来的表已经闲置为空了，可以将第二遍归并排序的结果再放回去，这样交替进行，最终可以实现归并排序。空间代价是 $O(n)$。

**算法的实现**

归并排序算法通过三层来实现(需要一个和原表大小相同的辅助表)：

1. 最下层：实现表中相邻2个有序子序列的归并，将归并后的有序子序列存入另一个有序表的相同位置；

2. 中间层：对序列里的这种成对子序列执行步骤1，对序列完成一次完整的归并；

3. 最高层：在原表和辅助表之间交替进行上述操作，直到整个表里只有一个有序序列时排序完成。


备注：一般情况下被处理的表里元素数量不是2的幂，所以要考虑表尾端不规则的情况。

In [14]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum
        
def merge_sort(lst):
    sliceLen = 1
    lstLen = len(lst)
    templst = [None]*lstLen
    while sliceLen<lstLen:
        merge_pass(lst,templst,sliceLen,lstLen)
        sliceLen*=2
        merge_pass(templst,lst,sliceLen,lstLen) # 结果存回原位
        sliceLen*=2
        
def merge_pass(lfrom,lto,sliceLen,lstLen):
    i = 0 
    while i + 2*sliceLen<lstLen: # 归并长度为 sliceLen 的2段序列
        merge(lfrom,lto,i,i+sliceLen,i+2*sliceLen)
        i += 2*sliceLen
    if i + sliceLen < lstLen: # 归并2段有序序列，第二段序列长度小于 sliceLen
        merge(lfrom,lto,i,i + sliceLen,lstLen)
    else:
        for j in range(i,lstLen): # 只剩下最后一个长度小于sliceLen的有序序列，复制到辅助表
            lto[j] = lfrom[j]
    
def merge(lfrom,lto,low,mid,high):
    i,j = low,mid # 开始的起点
    k = low 
    
    while i<mid and j<high:
        if lfrom[i].key<=lfrom[j].key:       # 取较小的元素存入辅助表lto的相同位置
            lto[k] = lfrom[i]
            i += 1
        else:
            lto[k] = lfrom[j]
            j += 1
        k += 1 
    while i<mid: # 复制序列1的剩余记录
        lto[k] = lfrom[i]
        i += 1
        k += 1
    while j<high: # 复制序列2的剩余记录
        lto[k] = lfrom[j]
        j += 1
        k += 1

In [15]:
a = [100,3,99,5,2,1,10,8,66,8]
lst = [record(i,i) for i in a]
merge_sort(lst)
for j in lst:
    print(j.key)

1
2
3
5
8
8
10
66
99
100


**算法复杂度分析**

1. 时间复杂度：归并的次数不会多于 $\log_2 n +1$，每次归并的比较次数为 $O(n)$，所以复杂度是 $O(n\log_2 n)$;
2. 空间复杂度：因为用了复制表，所以复杂度是 $O(n)$。

**稳定性和适应性**

算法具有稳定性，但不具有适应性，归并的次数是固定的，但也可以在比较前对归并的子序列进行前置判断来降低归并次数。

# 其他排序方法

## 分配排序和基数排序

前面介绍的是基于关键码的排序，本节介绍有关排序的另一种想法，它并不基于关键码比较，是基于一种固定位置的分配和收集。

### 分配与排序

如果关键码只有很少几个不同的值，存在一种简单直观的排序方法：

1. 为每个关键码设定一个桶(即是可以容纳多个元素的的容器，例如用连续表或者链表);

2. 排序时简单地根据关键码把数据放入相应桶中；

3. 存入所有数据后，按照关键码顺序收集各个桶中的数据，就得到了排序序列。

例如关键码取值整数0~9，只需要10个桶就可以完成排序。做一遍分配，做一遍收集。

### 多轮分配和排序

上述的分配排序是基于单个维度的关键码，同样的关键码个数对应桶的数量有限；我们可以通过多维的元组来扩充其能力。然后通过多轮分配(每一轮是一个维度)和收集，完成以这种元组为关键码的排序工作。

抽象看，这种元组关键码类似于“字符串”。关键码元组的每个元素就是一个字符，关键码相当于字符串，自然序就是这种串的字典序。

**一个例子**

考虑以三元组 (a,a,a) 为关键码的序列，其中a的取值范围为 $\{0,1,2,3\}$。考虑下面待排序的关键码序列：
<img src='picture\sort_7.png'>

因为关键码是固定长度的三元组，关键码中的每个元素取值也很少，可以用分配排序完成针对一个元组元素的排序，然后通过多轮分配排序和收集完成排序。具体有两种分配排序方法。

1. 从最高位(左侧)开始考虑关键码的元素，称为 **高位优先方法**。

    * 按这种方法处理一遍，得到下面的序列；
    * 然后要对每个分桶，按照关键码的第二位置元素再进行第二轮分配排序，会出现子桶；
    * 再对子序列的子序列再排序，最终可以实现整个序列的排序。比较麻烦的是，要考虑越来越多的子序列，要记录相关信息。
<img src='picture\sort_8.png'>


2. 从最低位开始，称为 **低位优先方法**。

    * 这时将数据按照关键码元组的最后一位的顺序收集，实现了关键码的分段有序，每一段集合里的元素是整体低于下一段的(意思是，如果前两位相等的情况下)。如下图左所示；
    * 然后按照关键码元组的倒数第二位对关键码进行分配和收集，这时关键码元组按照后两位是递增分段有序的，如下图右所示；
    * 我们最后再按照最高位进行一次分配和收集，就可以完成整体的排序。
    
    
<img src='picture\sort_9.png'>

由上面的分析可知，采用最低位优先方法，更加规范和简单。下面考虑这种方法的实现。

如果关键码的每位都是数字，上述关键码元组就像是按某种进制(以某个数为基数，比如10)表示的一个整数。排序过程就是从低位到高位逐步进行分配和收集的过程。处理过程就像按基数逐位处理，因此这种多轮分配排序也称为**基数排序**。

**低位优先的算法实现**

做2点约定：
1. 关键码对应的元素存储在顺序表里，在python里是list;
2. 第j个关键码元组 $k^j = (x_0^j,x_1^j,\cdots,x_{d-1}^j)$的元素都是基于10进制的，取值范围是 ：0$\leq x_i^j \leq r-1,0\leq i\leq d-1$

In [65]:
def radix_sort(lst,d):
    rlists = [[] for i in range(10)]
    for m in range(-1,-d-1,-1):# m 倒序，意味着从低位开始排序
        for j in range(len(lst)): # 固定m，按照第m个维度进行排序
            rlists[lst[j][m]].append(lst[j])
        j = 0 
        for i in range(10):
            tmp = rlists[i] # 第i个桶里的元素
            for _ in range(len(tmp)): # 将桶tmp的元素依次放回到lst
                lst[j] = tmp[_]
                j += 1
            rlists[i].clear() # 放回之后桶可以清空

In [66]:
lst=[(0,2,3),(3,9,2),(3,2,8),(5,1,3),(4,2,2),(2,1,0)]
radix_sort(lst,3)
lst

[(0, 2, 3), (2, 1, 0), (3, 2, 8), (3, 9, 2), (4, 2, 2), (5, 1, 3)]

算法的时间复杂度是 $O(d\times (n+r))$；空间复杂度取决于clear的实现方法，如果clear是简单为表换一块空表存储区，复杂度是 $O(n)$,如果只是将表的长度置为 0,复杂度可能会达到 $O(m\times n)$。

## 一些与排序有关的问题

**混成方法**

除了上述我们提到的简单排序算法(插入排序、选择排序、交换排序)和复杂排序算法(快速排序、归并排序、堆排序)之外，还可以采用多种算法的结合，我们称为**混成方法**：

1. 在快速排序中，序列被划分为越来越短的序列。对于短序列，采用简单插入排序的实际效果可能会好于快速排序；
2. 对元素比较少的序列，比如长度为8的序列，可能采用插入排序会比归并排序效果更好。

python中的排序函数 sort，就是一种混成式排序算法，称为Timsort,可以翻译为 **蒂姆排序**。

蒂姆排序是基于归并排序的稳定排序算法。结合使用了归并排序和插入排序，最坏的时间复杂度是 $O(n\log n)$,具有适应性；空间复杂度是 $O(n)$。试验表明，**蒂姆排序的平均性能好于快速排序，是目前实际表现最好的排序算法**。

**稳定性问题**

实际上任何一种算法，对于序列中的数据 $R_i$，关键码是 $k_i$，可以通过 $(k_i,i)$来扩展关键码，其中 i 是数据在序列中的下标。在 $k_i$相同时，可以比较下标。通过这种方式，序列中数据的关键码具有了唯一性。

这种方法具有普适性。但是相应的代价是：需要扫描修改数据的关键码，排序时增加了比较的开销；另外也需要为每一个数据元素增加一个下标，空间开销是 $O(n)$。

# 几种排序算法的比较

<img src='picture\sort_10.png'>

1. 平均时间上看：

    * 实践中快速排序非常快，但是最坏情况有 $O(n^2)$复杂度，不如归并排序；
    * 序列长度n较大时归并排序通常比堆排序更快，但实际需要很大的辅助空间；
    * 蒂姆排序在实际应用中处于最优地位，缺点是需要 $O(n)$ 的辅助空间。
    
2. 稳定性：

    * 简单排序算法大多是稳定的，但大部分时间性能好的排序算法都不稳定，如快速排序、堆排序等。
    * 一般来说，只做相邻记录关键码的比较和局部调整容易得到稳定性；
    * 高效排序算法中，只有归并排序能很自然得到稳定性，蒂姆排序的最主要操作是归并排序，结合其他技术，得到了很好的效果；
    * 稳定性是具体算法实现的性质，采用同一种排序算法，可以做出稳定实现和不稳定实现。

下面是几种常见排序方法的汇总：

In [75]:
class record:
    def __init__(self,key,datum):
        self.key=key 
        self.datum=datum


class Sort_collection():
    def __init__(self,lst):
        self.elems = list(lst)

    def insert_sort(self):
        # 插入排序
        elems = list(self.elems)
        for i in range(1,len(elems)):# 默认第一个元素是排好序的
            x = elems[i]
            j = i 
            while j>0 and elems[j-1].key>x.key:
                elems[j] = elems[j-1]
                j -= 1
            elems[j] = x 
        return elems 
    
    def insert_sort_dichotomy(self):
        # 插入排序+二分查找
        elems = list(self.elems)
        for i in range(1,len(elems)):
            x = elems[i]
            left,right=0,i-1 
            while left<=right:
                mid = int((left+right)/2)
                y = elems[mid]
                if y.key<=x.key:
                    left = mid + 1
                else:
                    right = mid - 1
            # 最后的left即是插入位置
            j = i-1  
            while j>=left:
                elems[j+1] = elems[j]
                j -= 1
            elems[left] = x 
        return elems   

    def select_sort(self):
        # 选择排序
        elems = list(self.elems)
        n = len(elems)
        for i in range(n-1):#最后剩下的元素必然是最大元素
            min_idx = i 
            for j in range(i+1,n):
                if elems[j].key<elems[min_idx].key:
                    min_idx = j 

            # 为了保证稳定性，两两交换位置进行挪动
            k = min_idx-1
            min_elem = elems[min_idx]
            while k>=i: 
                elems[k+1] = elems[k]
                k-=1
            elems[i] = min_elem
        return elems 

    def bubble_sort(self):
        #选择排序之气泡排序
        elems = list(self.elems)
        n = len(elems)
        for i in range(n):
            p = False 
            for j in range(1,n-i):
                if elems[j].key<elems[j-1].key:
                    elems[j],elems[j-1] = elems[j-1],elems[j]
                    p = True 
            if not p:
                break 
        return elems  

    def quick_sort(self):
        # 快速排序
        elems = list(self.elems)
        self.qsort_rec(elems,0,len(elems)-1)
        return elems 

    def qsort_rec(self,lst,l,r):
        # 递归排序
        if l>=r:
            return
        i,j = l,r 
        R = lst[i]
        while i<j:
            while i<j and lst[j].key>= R.key:
                j -= 1
            if i<j:
                lst[i] = lst[j]
                i += 1
            while i<j and lst[i].key<=R.key:
                i += 1
            if i<j:
                lst[j] = lst[i]
                j -= 1
        lst[i]  = R 
        self.qsort_rec(lst,l,i-1)
        self.qsort_rec(lst,i+1,r)

    def merge_sort(self):
        # 归并排序
        elems = list(self.elems)
        sliceLen = 1 # 有序子序列的长度
        n = len(elems)
        temp = [None]*n  # 临时表
        while sliceLen<n: # 当 sliceLen<n 时说明归并还没完成
            # 排序2次是为了保证最终排序完成的数据回到elem 
            self.merge_pass(elems,temp,sliceLen,n)
            sliceLen*=2
            self.merge_pass(temp,elems,sliceLen,n)
            sliceLen*=2
        return elems 

    def merge_pass(self,lfrom,lto,sliceLen,n):
        i = 0  
        while i + 2*sliceLen<n:
            self.merge_slices(lfrom,lto,i,i+sliceLen,i+2*sliceLen)
            i+= 2*sliceLen
        if  i + sliceLen<n:
            self.merge_slices(lfrom,lto,i,i+sliceLen,n)
            i += sliceLen
        else:
            for j in range(i,n): 
                lto[j] = lfrom[j]

    def merge_slices(self,lfrom,lto,low,mid,high):
        i,j = low,mid # 两段待归并序列的起点
        k = low # 复制到lto序列的起点
        while i<mid and j<high:
            if lfrom[i].key<=lfrom[j].key:
                lto[k] = lfrom[i]
                i += 1
            else:
                lto[k] = lfrom[j]
                j += 1
            k += 1
        while i<mid: # 将剩余的部分复制到临时表
            lto[k] = lfrom[i]
            i += 1
            k += 1
        while j<high: # 将剩余的部分复制到临时表
            lto[k] = lfrom[j]
            j += 1
            k += 1

    def heap_sort(self):
        elems = list(self.elems)
        def sift_down(lst,e,begin,end): # 大顶堆
            i,j = begin,2*begin+1
            while j<end:
                if j+1<end and elems[j+1].key>elems[j].key:
                    j += 1
                if e.key>elems[j].key:
                    break 
                elems[i] = elems[j]
                i,j = j,2*j+1

            elems[i] = e

        end = len(elems)
        for i in range(end//2,-1,-1): # 构建大顶堆
            sift_down(elems,elems[i],i,end)

        # 按照从小到大顺序输出
        for j in range(end-1,0,-1):
            e = elems[j]
            elems[j] = elems[0]
            sift_down(elems,e,0,j) # sift_down函数里的end是不作为下标的，只是一个停止判断符
        return elems 


    def print(self,lst,sort_type=None):
        res = [i.key for i in lst]
        if sort_type:
            print(sort_type + ':\n',res)
        else:
            print(res)

In [76]:
a = [3,5,2,8,10,8,66]
lst = [record(i,i) for i in a]
t=Sort_collection(lst)
insert_lst = t.insert_sort()
t.print(insert_lst,sort_type='插入排序')
insert_dich_lst = t.insert_sort_dichotomy()
t.print(insert_dich_lst,sort_type='二分法插入排序')
select_lst = t.select_sort()
t.print(select_lst,sort_type='选择排序')
bubble_lst = t.bubble_sort()
t.print(bubble_lst,sort_type='交换排序之气泡排序')
quick_lst = t.quick_sort()
t.print(quick_lst,sort_type='快速排序')
merge_lst = t.merge_sort()
t.print(merge_lst,sort_type='归并排序')
heap_lst = t.heap_sort()
t.print(heap_lst,sort_type='堆排序')

插入排序:
 [2, 3, 5, 8, 8, 10, 66]
二分法插入排序:
 [2, 3, 5, 8, 8, 10, 66]
选择排序:
 [2, 3, 5, 8, 8, 10, 66]
交换排序之气泡排序:
 [2, 3, 5, 8, 8, 10, 66]
快速排序:
 [2, 3, 5, 8, 8, 10, 66]
归并排序:
 [2, 3, 5, 8, 8, 10, 66]
堆排序:
 [2, 3, 5, 8, 8, 10, 66]


In [2]:
1024*1024*1024

1073741824

# 练习

## [合并两个有序数组](https://leetcode-cn.com/problems/merge-sorted-array/)

In [29]:
class Solution:
    def merge(self, nums1: list, m: int, nums2: list, n: int) -> None:
        """
        Do not return anything, modify nums1 in-place instead.
        """
        if m == 0:
            nums1[:] = nums2[:]
        else:
            p,r = m,m 
            for j in nums2:
                while p>0 and j<nums1[p-1]:
                    nums1[p] = nums1[p-1]
                    p -= 1
                nums1[p] = j 
                r += 1
                p = r

In [30]:
t=Solution()
t.merge(nums1=[2,0], m=1, nums2=[1], n=1)

## [多数元素](https://leetcode-cn.com/problems/majority-element/)

In [58]:
class Solution:
    def majorityElement(self, nums: list) -> int:
        if len(nums) == 1:
            return nums[0]
        i = 1 
        while i<len(nums):
            key = nums[i]
            j = i
            while j>=1 and nums[j-1]>key:
                nums[j] = nums[j-1]
                j -= 1
            nums[j] = key 
            i += 1 
        return nums[len(nums)//2]
    
    def majorityElement_v2(self, nums: list) -> int: # 摩尔投票法
        cnt = 1
        key = nums[0]
        for i in nums[1:]:
            if i == key:
                cnt += 1
            else:
                cnt -= 1 
            if cnt==0:
                key = i
                cnt = 1
        return key    

In [59]:
t=Solution()
nums=[2,1,1,1,1,2,2]
nums=[1,1,1,2]
nums=[1,2,2,2]
t.majorityElement_v2(nums=nums)

2

## [存在重复元素](https://leetcode-cn.com/problems/contains-duplicate/submissions/)

## [有效的字母异位词](https://leetcode-cn.com/problems/valid-anagram/)

## [变位词组](https://leetcode-cn.com/problems/sfvd7V/)

## [丢失的数字](https://leetcode-cn.com/problems/missing-number/submissions/)

## [ 两个数组的交集](https://leetcode-cn.com/problems/intersection-of-two-arrays/)

## [找不同](https://leetcode-cn.com/problems/find-the-difference/)

## [第三大的数](https://leetcode-cn.com/problems/third-maximum-number/)

In [89]:
class Solution:
    def thirdMax(self, nums: list) -> int:# 三指针
        a, b, c = float('-inf'), float('-inf'), float('-inf')
        for num in nums:
            if num > a:
                a, b, c = num, a, b
            elif a > num > b:
                b, c = num, b
            elif b > num > c:
                c = num
        return a if c == float('-inf') else c

## [分发饼干](https://leetcode-cn.com/problems/assign-cookies/)

## [相对名次](https://leetcode-cn.com/problems/relative-ranks/)

## [数组拆分 I](https://leetcode-cn.com/problems/array-partition-i/)

## [*最长和谐子序列](https://leetcode-cn.com/problems/longest-harmonious-subsequence/)

## [三个数的最大乘积](https://leetcode-cn.com/problems/maximum-product-of-three-numbers/)

## [*错误的集合](https://leetcode-cn.com/problems/set-mismatch/)

## [*词典中最长的单词](https://leetcode-cn.com/problems/longest-word-in-dictionary/)

## [至少是其他数字两倍的最大数](https://leetcode-cn.com/problems/largest-number-at-least-twice-of-others/)

## [公平的糖果棒交换](https://leetcode-cn.com/problems/fair-candy-swap/)

## [按奇偶排序数组](https://leetcode-cn.com/problems/sort-array-by-parity/)

## [按奇偶排序数组 II](https://leetcode-cn.com/problems/sort-array-by-parity-ii/)

## [三角形的最大周长](https://leetcode-cn.com/problems/largest-perimeter-triangle/)

## [*有序数组的平方](https://leetcode-cn.com/problems/squares-of-a-sorted-array/)

## [K 次取反后最大化的数组和](https://leetcode-cn.com/problems/maximize-sum-of-array-after-k-negations/)

## [距离顺序排列矩阵单元格](https://leetcode-cn.com/problems/matrix-cells-in-distance-order/)

## [高度检查器](https://leetcode-cn.com/problems/height-checker/)

## [数组的相对排序](https://leetcode-cn.com/problems/relative-sort-array/)

In [282]:
class Solution:
    def relativeSortArray(self, arr1: list, arr2: list) -> list:
        def mycmp(x: int) -> (int, int):
            return (0, rank[x]) if x in rank else (1, x)
        
        rank = {x: i for i, x in enumerate(arr2)}
        arr1.sort(key=mycmp)
        return arr1

In [283]:
arr1=[28,6,22,8,44,17]

arr2=[22,28,8,6]
t=Solution()
t.relativeSortArray(arr1,arr2)

[22, 28, 8, 6, 17, 44]

## [最小绝对差](https://leetcode-cn.com/problems/minimum-absolute-difference/)

## [数组序号转换](https://leetcode-cn.com/problems/rank-transform-of-an-array/)

## [矩阵中战斗力最弱的 K 行](https://leetcode-cn.com/problems/the-k-weakest-rows-in-a-matrix/)

## [检查整数及其两倍数是否存在](https://leetcode-cn.com/problems/check-if-n-and-its-double-exist/)

## [根据数字二进制下 1 的数目排序](https://leetcode-cn.com/problems/sort-integers-by-the-number-of-1-bits/)

## [有多少小于当前数字的数字](https://leetcode-cn.com/problems/how-many-numbers-are-smaller-than-the-current-number/)

## [两个数组间的距离值](https://leetcode-cn.com/problems/find-the-distance-value-between-two-arrays/)

In [298]:
class Solution:
    def findTheDistanceValue(self, arr1: list, arr2: list, d: int) -> int:
        arr2.sort()
        res = 0
        for i in arr1:
            j = 0 
            find = False
            while j<len(arr2):
                dis = arr2[j] - i 
                if abs(dis)>d:
                    if dis<0:
                        j += 1
                    else:
                        find = True
                        break 
                else:
                    break
            if find or j == len(arr2):
                res += 1
        return res 



## [非递增顺序的最小子序列](https://leetcode-cn.com/problems/minimum-subsequence-in-non-increasing-order/)

## [通过翻转子数组使两个数组相等](https://leetcode-cn.com/problems/make-two-arrays-equal-by-reversing-sub-arrays/)

## [数组中两元素的最大乘积](https://leetcode-cn.com/problems/maximum-product-of-two-elements-in-an-array/)

## [去掉最低工资和最高工资后的工资平均值](https://leetcode-cn.com/problems/average-salary-excluding-the-minimum-and-maximum-salary/)

## [判断能否形成等差数列](https://leetcode-cn.com/problems/can-make-arithmetic-progression-from-sequence/)

## [特殊数组的特征值](https://leetcode-cn.com/problems/special-array-with-x-elements-greater-than-or-equal-x/)

## [删除某些元素后的数组均值](https://leetcode-cn.com/problems/mean-of-array-after-removing-some-elements/)

## [ 按照频率将数组升序排序](https://leetcode-cn.com/problems/sort-array-by-increasing-frequency/)

## [卡车上的最大单元数](https://leetcode-cn.com/problems/maximum-units-on-a-truck/)

## [将句子排序](https://leetcode-cn.com/problems/sorting-the-sentence/)

## [两个数对之间的最大乘积差](https://leetcode-cn.com/problems/maximum-product-difference-between-two-pairs/)

## [学生分数的最小差值](https://leetcode-cn.com/problems/minimum-difference-between-highest-and-lowest-of-k-scores/)

## [*早餐组合](https://leetcode-cn.com/problems/2vYnGI/)

In [430]:
class Solution:
    def breakfastNumber(self, staple: list, drinks: list, x: int) -> int:
        staple.sort()
        drinks.sort()
        def dichotomy(lst,key):
            i,j = 0,len(lst)
            while i<j:
                mid = (i+j)//2
                if key<lst[mid]:
                    j = mid
                else:
                    i = mid + 1
            return i
        max_food_i = dichotomy(staple,x-drinks[0])
        res = 0
        for food in staple[:max_food_i]:
            drink_i = dichotomy(drinks,x-food)
            res += drink_i
        return res % 1000000007

In [431]:
staple=[10,20,5]
drinks=[5,5,2]
x=15
t = Solution()
t.breakfastNumber(staple, drinks, x)

6

## [采购方案](https://leetcode-cn.com/problems/4xy4Wx/)

## [完成一半题目](https://leetcode-cn.com/problems/WqXACV/)

## [数组中重复的数字](https://leetcode-cn.com/problems/shu-zu-zhong-zhong-fu-de-shu-zi-lcof/)

## [调整数组顺序使奇数位于偶数前面](https://leetcode-cn.com/problems/diao-zheng-shu-zu-shun-xu-shi-qi-shu-wei-yu-ou-shu-qian-mian-lcof/)

## [扑克牌中的顺子](https://leetcode-cn.com/problems/bu-ke-pai-zhong-de-shun-zi-lcof/)

## [三数之和](https://leetcode-cn.com/problems/3sum/)

## [三数之和的多种可能](https://leetcode-cn.com/problems/3sum-with-multiplicity/)

## [ 最接近的三数之和](https://leetcode-cn.com/problems/3sum-closest/)

## [四数之和](https://leetcode-cn.com/problems/4sum/)

## [合并区间](https://leetcode-cn.com/problems/merge-intervals/)

## [颜色分类](https://leetcode-cn.com/problems/sort-colors/)

## [*排序链表](https://leetcode-cn.com/problems/sort-list/)

## [*最大数](https://leetcode-cn.com/problems/largest-number/)

## [*存在重复元素 III](https://leetcode-cn.com/problems/contains-duplicate-iii/)

## [摆动排序 II](https://leetcode-cn.com/problems/wiggle-sort-ii/)

## [前 K 个高频元素](https://leetcode-cn.com/problems/top-k-frequent-elements/)

## [最大整除子集](https://leetcode-cn.com/problems/largest-divisible-subset/)

## [有序矩阵中第 K 小的元素](https://leetcode-cn.com/problems/kth-smallest-element-in-a-sorted-matrix/)

## [根据身高重建队列](https://leetcode-cn.com/problems/queue-reconstruction-by-height/)

## [无重叠区间](https://leetcode-cn.com/problems/non-overlapping-intervals/)

## [寻找右区间](https://leetcode-cn.com/problems/find-right-interval/)

## [ 用最少数量的箭引爆气球](https://leetcode-cn.com/problems/minimum-number-of-arrows-to-burst-balloons/)

## [最少移动次数使数组元素相等 II](https://leetcode-cn.com/problems/minimum-moves-to-equal-array-elements-ii/)

## [供暖器](https://leetcode-cn.com/problems/heaters/)

## [通过删除字母匹配到字典里最长单词](https://leetcode-cn.com/problems/longest-word-in-dictionary-through-deleting/)

## [数组中的 k-diff 数对](https://leetcode-cn.com/problems/k-diff-pairs-in-an-array/)

## [ 最短无序连续子数组](https://leetcode-cn.com/problems/shortest-unsorted-continuous-subarray/)

## [部分排序](https://leetcode-cn.com/problems/sub-sort-lcci/submissions/)

## [有效三角形的个数](https://leetcode-cn.com/problems/valid-triangle-number/)

## [最长数对链](https://leetcode-cn.com/problems/maximum-length-of-pair-chain/)

## [找到 K 个最接近的元素](https://leetcode-cn.com/problems/find-k-closest-elements/)

## [*重构字符串](https://leetcode-cn.com/problems/reorganize-string/)

In [71]:
class Solution:
    def reorganizeString(self, s: str) -> str:
        if len(s)<2:
            return s 
        
        # 统计次数
        d = {}
        for i in s:
            d[i] = d.get(i,0) + 1
        
        #最大次数超过一半，返回''
        lst = [(i,d[i]) for i in d]
        lst.sort(key=lambda x:-x[1])
        if lst[0][1]>(len(s)+1)//2:
            return ''
        
        # 建大顶堆
        def siftdown(lst,e,begin,end):
            i,j = begin,2*begin+1
            while j<end:
                if j+1<end and lst[j+1][1]>lst[j][1]:
                    j = j+1
                if e[1]>=lst[j][1]:
                    break
                lst[i] = lst[j]
                i,j = j,2*j+1
            lst[i] = e
        def siftup(lst,e,last):# 此处last 是最后一元素的位置
            i,j = last,(last-1)//2
            while j>=0 and lst[j][1]<e[1]:
                lst[i] = lst[j]
                i,j = j,(j-1)//2
            lst[i] = e 
        
        def build_big_heap(lst):  
            end = len(lst)
            for i in range(end//2,-1,-1):
                siftdown(lst,lst[i],i,end)
        
        def dequeue(lst):
            e0 = lst[0]
            e = lst.pop()
            if len(lst)>0:
                siftdown(lst,e,0,len(lst))
            return e0
        def enqueue(lst,e):
            lst.append(None)
            siftup(lst,e,len(lst)-1)
                    
        build_big_heap(lst)
        res_lst = []
        while len(lst)>1:
            i,i_cnt = dequeue(lst)
            j,j_cnt = dequeue(lst)
            res_lst.extend([i,j])
            print(i,i_cnt,j,j_cnt,res_lst)
            d[i] -= 1
            d[j] -= 1
            if d[i]>0:
                enqueue(lst,(i,d[i]))
                print(lst)
            if d[j]>0:
                enqueue(lst,(j,d[j]))
        if lst:
            res_lst.append(lst[0][0])
        return ''.join(res_lst)       

In [72]:
t=Solution()
t.reorganizeString(s="vvvlo")

v 3 o 1 ['v', 'o']
[('v', 2), ('l', 1)]
v 2 l 1 ['v', 'o', 'v', 'l']
[('v', 1)]


'vovlv'

## [距离相等的条形码](https://leetcode-cn.com/problems/distant-barcodes/)

## [一手顺子](https://leetcode-cn.com/problems/hand-of-straights/)

## [全排列](https://leetcode-cn.com/problems/permutations/)

## [全排列 II](https://leetcode-cn.com/problems/permutations-ii/)

## [*重新排序得到 2 的幂](https://leetcode-cn.com/problems/reordered-power-of-2/)

## [优势洗牌](https://leetcode-cn.com/problems/advantage-shuffle/)

## [救生艇](https://leetcode-cn.com/problems/boats-to-save-people/)

## [最小差值 II](https://leetcode-cn.com/problems/smallest-range-ii/)

## [*最小面积矩形](https://leetcode-cn.com/problems/minimum-area-rectangle/)

In [22]:
import collections
class Solution(object):
    def minAreaRect(self, points):
        points.sort()
        length_d = {}
        len_lst = []
        for x, y in points:
            if x not in length_d:
                length_d[x] = [y]
                len_lst.append(x)
            else:
                length_d[x].append(y)

        lastx = {}
        ans = float('inf')
        for len_right in len_lst:
            width_lst = length_d[len_right]
            for j in range(len(width_lst)):
                wid_up = width_lst[j]
                for i in range(0,j):
                    wid_down = width_lst[i]
                    if (wid_down, wid_up) in lastx:
                        ans = min(ans, (len_right - lastx[(wid_down, wid_up)]) * (wid_up-wid_down))
                    lastx[(wid_down, wid_up)] = len_right
        return ans if ans < float('inf') else 0

In [23]:
points=[[1,1],[1,3],[3,1],[3,3],[2,2]]
t=Solution()
t.minAreaRect(points)

4

## [使数组唯一的最小增量](https://leetcode-cn.com/problems/minimum-increment-to-make-array-unique/)

## [令牌放置](https://leetcode-cn.com/problems/bag-of-tokens/)

## [按递增顺序显示卡牌](https://leetcode-cn.com/problems/reveal-cards-in-increasing-order/)

## [二倍数对数组](https://leetcode-cn.com/problems/array-of-doubled-pairs/)

## [两地调度](https://leetcode-cn.com/problems/two-city-scheduling/)

## [受标签影响的最大值](https://leetcode-cn.com/problems/largest-values-from-labels/)

## [*拼车](https://leetcode-cn.com/problems/car-pooling/)

In [1]:
class Solution:
    def carPooling(self, trips: list, capacity: int) -> bool:
        f = [0 for _ in range(1002)]
        for x,begin,end in trips:
            f[begin] += x
            f[end] -= x
        
        
        p = 0 
        for i in range(len(f)):
            p += f[i]
            if p>capacity:
                return False
        return True

In [11]:
class Solution:
    def carPooling(self, trips: list, capacity: int) -> bool:
        import heapq
        trips.sort(key = lambda x:x[1])
        count = 0
        heap_lst = []
        heapq.heapify(heap_lst)
        for p,begin,end in trips:
            while heap_lst and begin>=heap_lst[0][0]:
                _,passenger_num  = heapq.heappop(heap_lst)
                count -= passenger_num
            count += p 
            if count>capacity:
                return False 
            heapq.heappush(heap_lst,[end,p])
        return True

In [12]:
t=Solution()
trips = [[3,2,7],[3,7,9],[8,3,9]]
capacity = 11
t.carPooling(trips, capacity)

True

## [所有排列中的最大和](https://leetcode-cn.com/problems/maximum-sum-obtained-of-any-permutation/)

## [删除被覆盖区间](https://leetcode-cn.com/problems/remove-covered-intervals/)

## [转变数组后最接近目标值的数组和](https://leetcode-cn.com/problems/sum-of-mutated-array-closest-to-target/)

## [两棵二叉搜索树中的所有元素](https://leetcode-cn.com/problems/all-elements-in-two-binary-search-trees/)

## [获取你好友已观看的视频](https://leetcode-cn.com/problems/get-watched-videos-by-your-friends/)

## [*将矩阵按对角线排序](https://leetcode-cn.com/problems/sort-the-matrix-diagonally/)

## [对角线遍历 II](https://leetcode-cn.com/problems/diagonal-traverse-ii/)

## [数组大小减半](https://leetcode-cn.com/problems/reduce-array-size-to-the-half/)

## [通过投票对团队排名](https://leetcode-cn.com/problems/rank-teams-by-votes/)

## [将整数按权重排序](https://leetcode-cn.com/problems/sort-integers-by-the-power-value/)

## [点菜展示表](https://leetcode-cn.com/problems/display-table-of-food-orders-in-a-restaurant/)

## [检查一个字符串是否可以打破另一个字符串](https://leetcode-cn.com/problems/check-if-a-string-can-break-another-string/)


## [重新排列句子中的单词](https://leetcode-cn.com/problems/rearrange-words-in-a-sentence/)

## [切割后面积最大的蛋糕](https://leetcode-cn.com/problems/maximum-area-of-a-piece-of-cake-after-horizontal-and-vertical-cuts/)

## [数组中的 k 个最强值](https://leetcode-cn.com/problems/the-k-strongest-values-in-an-array/)

## [同整数的最少数目](https://leetcode-cn.com/problems/least-number-of-unique-integers-after-k-removals/)

## [满足条件的子序列数目](https://leetcode-cn.com/problems/number-of-subsequences-that-satisfy-the-given-sum-condition/)

## [子数组和排序后的区间和](https://leetcode-cn.com/problems/range-sum-of-sorted-subarray-sums/)

## [*三次操作后最大值与最小值的最小差](https://leetcode-cn.com/problems/minimum-difference-between-largest-and-smallest-value-in-three-moves/)

## [*两球之间的磁力](https://leetcode-cn.com/problems/magnetic-force-between-two-balls/)

思路参考：https://www.acwing.com/solution/content/33988/

In [45]:
class Solution:
    def maxDistance(self, position: list, m: int) -> int:
        def check(x: int) -> bool:
            pre = position[0]
            cnt = 1
            for i in range(1, len(position)):
                if position[i] - pre >= x:
                    pre = position[i]
                    cnt += 1
            return cnt >= m

        position.sort()
        left, right, ans = 1, position[-1] - position[0], -1 # 此处left，right表示距离
        while left <= right:
            print(left,right)
            mid = (left + right) // 2
            if check(mid):
                ans = mid
                left = mid + 1
            else:
                right = mid - 1
            print(ans,left,right)
        
        return ans

In [46]:
t=Solution()
position=[1,2,3,4,7]
m=3
t.maxDistance(position, m)

1 6
3 4 6
4 6
3 4 4
4 4
3 4 3


3

## [ 你可以获得的最大硬币数目](https://leetcode-cn.com/problems/maximum-number-of-coins-you-can-get/)

## [警告一小时内使用相同员工卡大于等于三次的人](https://leetcode-cn.com/problems/alert-using-same-key-card-three-or-more-times-in-a-one-hour-period/)

## [*无矛盾的最佳球队](https://leetcode-cn.com/problems/best-team-with-no-conflicts/)

## [*马戏团人塔](https://leetcode-cn.com/problems/circus-tower-lcci/)

[思路](https://leetcode-cn.com/problems/circus-tower-lcci/solution/python3-he-354ti-e-luo-si-tao-wa-yi-yang-an-height/)

## [等差子数组](https://leetcode-cn.com/problems/arithmetic-subarrays/)

## [字符频次唯一的最小删除次数](https://leetcode-cn.com/problems/minimum-deletions-to-make-character-frequencies-unique/)

## [*销售价值减少的颜色球](https://leetcode-cn.com/problems/sell-diminishing-valued-colored-balls/)

思路：https://leetcode-cn.com/problems/sell-diminishing-valued-colored-balls/solution/pai-xu-by-ykousbi-ji/

## [ 确定两个字符串是否接近](https://leetcode-cn.com/problems/determine-if-two-strings-are-close/)

## [K 和数对的最大数目](https://leetcode-cn.com/problems/max-number-of-k-sum-pairs/)

## [*石子游戏 VI](https://leetcode-cn.com/problems/stone-game-vi/)

## [*重新排列后的最大子矩阵](https://leetcode-cn.com/problems/largest-submatrix-with-rearrangements/)

[思路](https://leetcode-cn.com/problems/largest-submatrix-with-rearrangements/solution/zhong-xin-pai-lie-hou-zui-da-zi-ju-zhen-tv7pd/)

## [*绝对差值和](https://leetcode-cn.com/problems/minimum-absolute-sum-difference/)

## [*单线程 CPU](https://leetcode-cn.com/problems/single-threaded-cpu/submissions/)

## [矩阵中最大的三个菱形和](https://leetcode-cn.com/problems/get-biggest-three-rhombus-sums-in-a-grid/)

## [使数组元素相等的减少操作次数](https://leetcode-cn.com/problems/reduction-operations-to-make-the-array-elements-equal/)

## [*消灭怪物的最大数量](https://leetcode-cn.com/problems/eliminate-maximum-number-of-monsters/)

## [构造元素不等于两相邻元素平均值的数组](https://leetcode-cn.com/problems/array-with-elements-not-equal-to-average-of-neighbors/)

## [*游戏中弱角色的数量(dsp)](https://leetcode-cn.com/problems/the-number-of-weak-characters-in-the-game/)

## [从双倍数组中还原原数组](https://leetcode-cn.com/problems/find-original-array-from-doubled-array/)

## [出租车的最大盈利(dsp)](https://leetcode-cn.com/problems/maximum-earnings-from-taxi/)

## [*两个最好的不重叠活动](https://leetcode-cn.com/problems/two-best-non-overlapping-events/)

[思路](https://leetcode-cn.com/problems/two-best-non-overlapping-events/solution/shuo-ren-hua-you-xian-dui-lie-zen-yao-zu-li90/)

## [每一个查询的最大美丽值](https://leetcode-cn.com/problems/most-beautiful-item-for-each-query/)

## [*把数组排成最小的数](https://leetcode-cn.com/problems/ba-shu-zu-pai-cheng-zui-xiao-de-shu-lcof/)

## [最小时间差](https://leetcode-cn.com/problems/minimum-time-difference/)

## [*剧情触发时间](https://leetcode-cn.com/problems/ju-qing-hong-fa-shi-jian/)