# 第8章&ensp;线性时间排序

## 8.1&ensp;排序算法的下界

### 8.1-1&ensp;在一棵比较排序算法的决策树中，一个叶节点可能的最小深度？

$lg(\frac{n+1}{2}) = \lfloor lgn \rfloor$<br>
排序算法的决策树是一棵完全二叉树，完全二叉树是所有叶节点深度相同，且所有内部节点度为2的2叉树。

### 8.1-4&ensp;证明

根据定理8.1，k个元素需要做$\Omega(klgk)$次比较，一共有$\frac{n}{k}$个这样的序列，所以一共要做$\frac{n}{k}*\Omega(klgk)$次比较，即$\Omega(nlgk)$次比较。

## 8.2&ensp;计数排序

### 8.2-1&ensp;模仿

B = [0,0,1,1,2,2,3,3,4,6,6]

### 8.2-2&ensp;证明counting_sort是稳定的

C[A[j]] = C[A[j]] - 1这行代码保证了即使遇到了相同值得A[j]，那么第二次遇到时它的位置也会向前移动一位。for循环是从A的最右边往左边移动的，那么先遇到的A[j]\(在右边)其值就比后遇到的A[j]\(在左边)值大，在B中的位置也就更靠右边，这个顺序和在A中的顺序相同，所以它是稳定的。

### 8.2-3&ensp;证明

是正确的，但是不稳定。因为在A中先遇到的A[j]其C[A[j]]要比后遇到的A[j]的C[A[j]]要大。

### 8.2-4&ensp;在$\Theta(n+k)$时间内求出介于0到k之间的n个整数中有多少个落在区间[a...b]内

In [1]:
def counting(A,a,b):
    k = A[0]
    for i in A:
        if i > k:
            k = i
            
    C = [0 for _ in range(k+1)]
    
    for j1 in range(len(A)):
        C[A[j1]] += 1
    
    num = 0
    for j2 in range(a,b+1):
        num += C[A[j2]]
    
    return num

A = [6,0,2,0,1,3,4,6,1,3,2]
a = 0
b = 1
print(counting(A,a,b))

4


## 8.3&ensp;基数排序

#### 8.3-1&ensp;照图

### 8.3-2&ensp;

插入排序、归并排序、快速排序是稳定的；堆排序不是稳定的。<br>
能使任何排序算法都稳定：使用基数排序：先按照值的大小进行排序，再按照它们再原数组中的位置进行排序。额外时间开销是：第二次排序；额外空间排序：存储第一次排序的结果

### 8.3-3&ensp;利用归纳法证明

在代码第2行中，每次循环都会产生新的数组，并且这些数组在相应的位数上已经完成了排序，又因为是稳定的，那么不断循环，在所有的位数上都循环后产生的数组在任何（所有）位上都已经排序完成。

### 8.3-4&ensp;在$O(n)$时间内对0到$n^3$-1区间内的n个整数进行排序

用基数排序(radix_sort)，d = $\lceil log_{10} (n^3-1) \rceil$，每个数位有10个可能的取值，所以基数排序消耗的时间为$\Theta(d(n+10)) = \Theta(\lceil log_{10} (n^3-1) \rceil*(n+10))$

### 8.3-5&ensp;

在最坏情况下需要进行d轮排序，需要记录d-1堆卡片

## 8.4&ensp;桶排序

### 8.4-1&ensp;照图说话

[[],[0.13,0.16],[0.2],[0.39],[0.42],[0.53],[0.64],[0.79,0.71],[0.89],[]]<br>
[[],[0.13,0.16],[0.2],[0.39],[0.42],[0.53],[0.64],[0.71,0.79],[0.89],[]]<br>
[0.13,0.16,0.2,0.39,0.42,0.53,0.64,0.71,0.79,0.89

## 8.4-2&ensp;解释，修改

最坏情况：所有的元素都在B的一个桶里，B的其它桶都为空，此时，排序桶里的元素时用的是insert_sort，耗时为$\Theta(n^2)$

最坏情况时间代价为:$O(nlgn)$，排序桶里的元素时选用heap_sort

### 8.4-3&ensp;

设$X_i = I\{正面朝上的次数为i\}$，形成分布列如下：<br>

Xi|0|1|2
--|--|--|--
P|1/4|1/2|1/4

$E[X^2] = \frac{3}{2}$，&ensp;&ensp;$E^2[X] = 1$

## 思考题

### 8-1&ensp;比较排序的概率下界

b. LT的根节点到T的根节点的高度为1，所以LT的所有(任一)叶节点到T的根节点深度比到LT的根节点深度多1，同理RT。所以D(T) = D(LT) +LT叶节点数 + D(RT) + RT的叶节点数 = D(LT) + D(RT) + k(总叶节点数)

### 8-2&ensp;线性时间原址排序

In [None]:
B = [[],[]]
A = [0,1,0,1,0,1,1,1,0,0,0]
for i in A:
    if i == 0:
        B[0].append(i)
    elif i == 1:
        B[1].append(i)
    else:
        print('数组的关键字有误')

print(B)

In [1]:
A = [0.1,1.2,0.3,1.4,0.5,1.6,1.7,1.8,0.9,0.91,0.92]

def sort_A(A):
    i = -1
    while i < len(A) and int(A[i]) != 1:
        i += 1
    else:
        index = i
    
    for j in range(1,len(A)):
        if int(A[j]) == 0 and int(A[j-1]) == 1:
            A[j],A[index] = A[index],A[j]
            index += 1
    
    return A
    
sort_A(A)

[0.1, 0.3, 0.5, 0.9, 0.91, 0.92, 1.7, 1.8, 1.4, 1.2, 1.6]

In [2]:
A = [0.1,1.2,0.3,1.4,0.5,1.6,1.7,1.8,0.9,0.91,0.92]

def sort_A(A):
    i = -1
    while i < len(A) and int(A[i]) != 1:
        i += 1
    else:
        index = i
    
    for j in range(1,len(A)):
        if int(A[j]) == 0 and int(A[j-1]) == 1:
            A.insert(index,A[j])
            del A[j+1]
            index += 1
    
    return A
    
sort_A(A)

[0.1, 0.3, 0.5, 0.9, 0.91, 0.92, 1.2, 1.4, 1.6, 1.7, 1.8]

d. 算法a可以作为基数排序第2行的方法。因为它的时间代价是$O(n)$

### 8-4&ensp;水壶

a.<br>
```
for rk in red_kettles:
    
    bk = 1
    while bk <=n and rk != blue_kettles[bk]:
        bk += 1
    
    # 循环结束rk = blue_kettles[bk]
    从 blue_kettles中去掉blue_kettles[bk]
    配对(rk, blue_kettles[bk])

```

b. 根据定理8.1，在最坏情况下任何比较排序算法的下界都是$\Theta(nlgn)$

In [15]:
# %load 8-4_bucket.py
import random

def pairing(A,B,p,r):
    if p < r:
        i = random.randint(p,r)
        x = A[i]
        q = partition(B,p,r,x)
        partition(A,p,r,B[q])
        pairing(A,B,p,q-1)
        pairing(A,B,q+1,r)
    return A,B

def partition(A,p,r,x):
    i = p-1
    k = p-1
    for j in range(p,r+1):
        if A[j] <= x:
            i += 1
            A[j],A[i] = A[i],A[j]
            if A[i] < x:
                k += 1
                A[i],A[k] = A[k],A[i]

    return i

A = [17,3,15,7,11,9,13,5,1]
B = [17, 15, 13, 11, 9, 7, 5, 3, 1]
if __name__ == "__main__":
    p = 0
    r = len(A)-1
    print(pairing(A,B,p,r))

([1, 3, 5, 7, 9, 11, 13, 15, 17], [1, 3, 5, 7, 9, 11, 13, 15, 17])


至此，两个数组都已经排好序了，也就配对成功。最坏情况下的比较次数是$\Theta(n^2)$次

### 8-5&ensp;平均排序

a. 表示数组是升序排列<br>
b. [1,2,3,4,5,6,7,8,10,9]<br>
c. 根据k排序的的定义，将不等式的两边同时乘以k，然后左右两边同时减去$\sum\limits_{j=i+1}^{i+k-1}A[j]$可得$A[i]\le A[i+k]$