## 几种常见的排序

- 基于递归：插入，合并，快速
- 基于减治：插入
- 基于分治：合并，快速
- 基于变治：堆
- 只有堆排序是树的数据结构，其他是数组
![avatar](images/paixu.png)

### 第一种：冒泡排序

**基本思想:**
遍历列表，每次都把与当前元素与下一个是逆序的元素交换，把最大或最小的元素排到最后

**改进方法：**
如果对列表比较一遍没有交换元素，就可以停止算法了。

**时间复杂度:**
最坏情况平均情况：$O(n^2)$


**算法实现：**

In [17]:
def BubbleSort(array):
    """输入一个数组，输出一个非降序的数组"""
    tag=0#记录是否交换
    for i in range(len(array)-1):
        for j in range(len(array)-1-i):
            if array[j+1]<array[j]:#如果后一个数小于前一个数交换位置
                array[j+1],array[j]=array[j],array[j+1]
                tag=1
        if tag==0:#一次遍历没有交换，代表剩下数已有序
            return array
    return array

In [18]:
BubbleSort([89,45,68,90,29,34,17])

[17, 29, 34, 45, 68, 89, 90]

### 第二种：选择排序

**基本思想：**
遍历列表，找到最大或最小的与第一个没有排序好的交换

**复杂度分析：**
**任何输入**的情况下都是：$O(n^2)$，键的交换次数仅为$O(n)$


**算法实现：**

In [3]:
def SelectionSort(array):
    """输入一个数组，输出一个非降序序列"""
    for i in range(len(array)-1):
        min=i#存放剩余仍未排序最小值的下标
        for j in range(i+1,len(array)):
            if array[j]<array[min]:
                min=j
        array[i],array[min]=array[min],array[i]
    return array   

In [4]:
SelectionSort([89,45,68,90,29,34,17])

[17, 29, 34, 45, 68, 89, 90]

### 第三种：插入排序（减治法，递归）

**基本思想：**

减一法：假设前n-1个元素已经排序好了，则如何将最后一个元素 插入到其合适的位置中去。这个思想是自顶向下基于递归的，我们可以自低向下基于迭代来实现

**算法复杂度分析：**
具体分析见P103页

最好情况：输入为升序序列$O(n)$

最坏情况：输入为严格递减数组,$O(n^2)$

平均情况：$O(n)$


**算法实现：**

In [5]:
def InsertionSort(array):
    """输入一个数组，返回一个非降序的数组"""
    for i in range(1,len(array)):#从数组的第二个数开始插入排序
        v=array[i]
        j=i-1
        while(j>=0 and array[j]>v):#对第i个未排序的数，找到其合适的位置，从后向前遍历找到前面排好序数组中第一个不大于它的数，然后插在那个数的后面
            array[j+1]=array[j]
            j=j-1
        array[j+1]=v
    return array

In [6]:
InsertionSort([89,45,68,90,29,34,17])

[17, 29, 34, 45, 68, 89, 90]

### 第四种：shell排序

**基本思想：**

希尔排序(Shell's Sort)是插入排序的一种又称“缩小增量排序”（Diminishing Increment Sort），是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因D.L.Shell于1959年提出而得名。
希尔排序是把记录按下标的一定增量分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。


其他待补充

### 第五种：合并排序（分治法，递归）

**基本思想：**

- 将列表分为两个大小最接近的部分
- 递归地拆分，拆分时不保证顺序正确
- 返回上一层递归时将每两个小部分合并为有序的部分
- 继续返回给上一层递归，直到合并为完整列表

**复杂度分析：**

最好情况：O$(n)$,大概是0.25n

最坏情况：$O(nlog{n})$

**优缺点：**

稳定但是占用线性的额外空间

**算法实现：**

In [7]:
def Mergesort(array):
    """递归调用mergesort来对数组排序，输入一个可排序数组，输出一个非降序数组"""
    if len(array)<=1:
        return array
    if len(array)>1:
        listb=array[0:len(array)//2]
        listc=array[len(array)//2:]
        listb=Mergesort(listb)
        listc=Mergesort(listc)
        return Merge(listb,listc) 

In [8]:
def Merge(listb,listc):
    """将两个有序数组合并成一个数组，输入listb、listc两个有序数组，将已合并的有序数组存放在listd中，返回listd"""
    listd=[]
    i=0;j=0
    while (i<len(listb) and j<len(listc)):
        if(listb[i]<=listc[j]):
            listd.append(listb[i])
            i+=1
        else:
            listd.append(listc[j])
            j+=1
    if(i<len(listb)):
        listd=listd+listb[i:]
    else:
        listd=listd+listc[j:]
    return listd

In [9]:
Mergesort([8,3,2,9,7,1,5,4])

[1, 2, 3, 4, 5, 7, 8, 9]

### 第六种：快速排序(分治法，递归)

**基本思想：**
- 将列表参照某一个元素的值分为两个部分（最简单策略，选择第一个元素作为中心元素）
- 每个部分整体之间的位置就确定了
- 递归拆分每一个小部分
- 拆分完成后每一个部分内部顺序是正确的，且所有小部分之间的位置也是确定的
- 不需要返回上一层递归进行合并

**复杂度分析：**

- 最好的情况：$nlog{n}$

一次分割最好的情况是在i,j移动的过程中i=j时停止，既有一个值与中值相等，这种情况下，每次分割需要比较n次这种情况下，键比较次数的递推表达式是：C<sub>best</sub>(n)=2C<sub>best</sub>(n/2)+n,根据这个表达式可得C<sub>best</sub>(n)=nlog<sub>2</sub>n



- 最坏的情况：${n^2}$

在最差的情况下，数组已经排过序array[0,1,2,3...n-1]是严格递增数列，我们将array[0]作为中轴，扫描会停止在array[1]上，导致array[0]会最终和自己交换
每次将会比较len(array)+1次，,所以总共比较次数是：C<sub>worst</sub>=（n+1）+n+....+3=(n+1)(n+2)/2

- 平均情况C<sub>avarage</sub>=1.39n$log_2{n}$

**与合并排序的区别：**

不需要合并，但是需要拆解

**算法改进：**

中轴的选择：随机选择、三平均划分法等

一个例子
![avatar](images/kuaipai.png)
![avatar](images/kuaipai2.png)

**算法实现（选取第一个为中轴）：**

```
伪代码
QuickSort(A,p,r)
    if p<r
        then q = Partition(A,p,r)
            QucikSort(A,p,q-1)
            QucikSort(A,q+1,r)
 
Partition(A,p,r)
    x=A[r]
    i=p-1
    for j from p to r-1
        if A[j]<=x
            then i=i+1
                exchange A[i],A[j]
    exchange A[i+1],A[r]
    return i+1
 ```

In [10]:
def QuickSort(arr,firstIndex,lastIndex):
    if firstIndex<lastIndex:
        divIndex=Partition(arr,firstIndex,lastIndex)
 
        QuickSort(arr,firstIndex,divIndex)        
        QuickSort(arr,divIndex+1,lastIndex)
    else:
        return arr

In [11]:
 
def Partition(arr,firstIndex,lastIndex):
    i=firstIndex-1
    for j in range(firstIndex,lastIndex):
        if arr[j]<=arr[lastIndex]:
            i=i+1
            arr[i],arr[j]=arr[j],arr[i]
    arr[i+1],arr[lastIndex]=arr[lastIndex],arr[i+1]
    return i   

In [12]:
arr=[5,3,1,9,8,2,4,7]
QuickSort(arr,0,7)
print(arr)

[1, 2, 3, 4, 5, 7, 8, 9]


### 第七种：堆排序

堆排序是一基于变治法的排序方法，其通常的存储结构为数组

**堆的概念**

- 堆（heap）可以定义为一颗二叉树，且满足两个条件（1）完全二叉树（2）父母优势（堆特性）每个节点的键都要大于或者等于其子女的键
- 在堆中左右子树并不存在顺序关系

**堆的性质**

- n 个节点的完全二叉树，它的高度为$\lfloor{log_2{n}}\rfloor$
- 堆的根总是包含了堆的最大元素
- 堆的一个节点以及该节点的子孙也是一个堆
- 为了方便起见可以使用数组来实现堆，具体方法是从上到下，从左到右的方式来记录堆元素，将0下标留空。
   - 父母节点将会位于数组的前  $\lfloor n/2 \rfloor$,而叶子节点将会占据后面 $\lceil n/2 \rceil$个位置
   - 每一个父母节点，它的子女将会是2*i 或是2*i+1 ,对于一个i键来说，它的父母节点将会是 $\lfloor i/2 \rfloor$

**堆的构造**

- *自低向下构造堆*

初始化一个包含n个节点的完全二叉树，按照指定的位置存放键（0索引空着或存放一个限位器其值大于所有数）

然后按照以下方式对其进行堆化，从最后的**父母**节点开始,到根为止，检查这些节点是否满足父母优势。如果该节点不满足父母优势，将该节点与其最大的子女
交换，然后在检查被交换过得子女节点是否满足父母优势。这个过程一直继续到父母优势满足为止

In [15]:
def HeapBottomUp(array):
    ran=(len(array)-1)//2
    for i in range(ran,0,-1):
        k=i
        v=array[k]
        heap=False
        while ((not heap) and (2*k<=len(array)-1)):
            j=2*k 
            if j<len(array)-1:
                if array[j]<array[j+1]:
                    j=j+1
            if v>=array[j]:
                heap=True
            else:
                array[k]=array[j]
                k=j
                array[k]=v
    return array   

In [16]:
array=[-1,2,9,7,6,5,8]
HeapBottomUp(array)

[-1, 9, 6, 8, 2, 5, 7]

复杂度分析
最坏的情况下：O(n)

- *自顶向下构造堆*

这种算法（效率较上面一种方法较低）通过把新的键连续插入预先构造好的堆，来构造一个新堆

把包括键K的新节点附件到当前最后一个叶子节点的后面，然后按照如下方法将K键放入合适的位置

拿K键与其父母键比较。如果后者大于前者，算法停止；否则，交换这两个键并把K键与新的父母比较。这种交换一直持续到K不大于它的最后一个父母，或者是到达了根节点

算法复杂度分析：
O(n$\log{n}$)

**删除任意键**

基本思路：将要删除的键与最后一个键交换，然后删除最后一个键，然后严格按照自顶向上的构造算法对树进行堆化

算法实现

算法复杂度:O($\log{n}$)

**堆排序**

基本思路：

第一步：构造堆

第二步：删除最大键

重复以上步骤n-1次

代码实现

算法复杂度：O($n\log{n}$)

### 第八种：计数排序