# 7.2-1

### 利用代入法证明: 递归式$T(n)=T(n-1)+θ(n)$的解为$T(n)=\theta(n^2)$

**代入法**求解递归式分为两步：

1. 猜测解的形式。
2. 用数学归纳法求出解中的常数，并证明解是正确的。

首先猜测其解为$T(n)=\theta(n^2)$，即有$T(n)=cn^2$，代入递推式可得：

\begin{align}
T(n)&=T(n-1)+\theta(n)\\
&=c(n-1)^2+n\\
&=cn^2+(1-2c)n+c\\
&\le cn^2
\end{align}

当满足$n>0, c\ge 1$时上式成立。因为: 令$f(c,n)=(1-2c)n+c$分别对$c$和$n$求导数得：

\begin{align}
&f(1,1)=0\\
&\frac{\partial f}{\partial c}=1-2n<0\\
&\frac{\partial f}{\partial n}=1-2c<0
\end{align}

因此$f(c,n)\le 0$恒成立，式$T(n)\le cn^2$恒成立。因此$T(n)=\theta(n^2)$。

# 7.2-2

### 当数组A的所有元素都具有相同值时，quicksort的时间复杂度是什么？

1. 每次划分都有$\theta(n)$的时间复杂度(partition函数)。
2. 当数组中所有元素都相同时，每次划分元素的索引都是第一个元素，A[p..q-1]为空，A[q+1..r]为剩下的$n-1$个元素。因此树变成了一条链，深度为$n-1$，即总共需要经过$n-1$次划分。

因此在这种情况下quicksort的时间复杂度为: $(n-1)\theta(n)=\theta(n^2)$

# 7.2-3

### 证明: 当数组A包含的元素不同，并且是按降序排列的时候，quicksort的时间复杂度为$\theta(n^2)$

举个例子，A=[5,4,3,2,1]

第1次划分: q=0, A[p..q-1]=**null**, A[q+1..r]=[4,3,2,5]

第2次划分: q=3, A[p..q-1]=[4,3,2], A[q+1..r]=**null**

第3次划分: q=0, A[p..q-1]=**null**, A[q+1..r]=[3,4]

第4次划分: q=1, A[p..q-1]=3, A[q+1..r]=**null**

可以看出，每一次划分都会产生一个空集，意味着整个划分的路径实际上是一条链。总共会经过$n-1$次划分，每次划分需要$\theta(n)$的时间复杂度，因此总的时间复杂度为$\theta(n^2)$。

# 7.2-4

### 证明在给定情景下insertion-sort的性能往往要优于quicksort

|交易时间|支票编号|
|---|:-:|
|20170926|99|
|20170826|76|
|20170726|54|
|20170626|30|
|20170526|22|
|20170426|14|
|20170326|9|
|20170226|5|
|20170126|1|

问题本质:将一个按照时间正序表示的数组变成按照支票编号进行升序排列的数组，即将数组 A=[1,5,9,14,22,30,54,76,99] 通过quicksort和insertion-sort再进行升序排序，并证明使用insertion-sort的性能更好。

In [21]:
def insertion_sort(A):
    for j in range(1, len(A)):
        key = A[j]
        # Insert A[j] into the sorted sequence A[1..j-1]
        i = j - 1
        while i >= 0 and A[i] > key:
            A[i+1] = A[i]
            i -= 1
        A[i+1] = key

![](fig2-2.png)

In [22]:
def partition(A, p, r):
    i = p - 1
    for j in range(p, r):
        if A[j] < A[r]:
            i += 1
            A[i], A[j] = A[j], A[i]
    A[i+1], A[r] = A[r], A[i+1]
    return i + 1

def quick_sort(A, p, r):
    if p < r:
        q = partition(A, p, r)
        quick_sort(A, p, q-1)
        quick_sort(A, q+1, r)

In [26]:
import time

quick_sort_time = []
insertion_sort_time = []

A = [1,5,9,14,22,30,54,76,99]

for i in range(1000):
    start = time.time()
    quick_sort(A[:], 0, len(A)-1)
    quick_sort_time.append(time.time() - start)
    
    start = time.time()
    insertion_sort(A[:])
    insertion_sort_time.append(time.time() - start)

print 'Quick-Sort average time:', sum(quick_sort_time) / len(quick_sort_time)
print 'Insertion-Sort average time:', sum(insertion_sort_time) / len(insertion_sort_time)

Quick-Sort average time: 2.13489532471e-05
Insertion-Sort average time: 3.75080108643e-06


实验结果: 反复运行1000次quicksort和insertion-sort，发现insertion-sort的平均耗时比quicksort少十倍左右。

分析：对于一个已经排好序的数组，使用insertion-sort不需要移动任何数据，程序的实际运行效果如下，时间复杂度仅为$O(n)$：

In [None]:
def insertion_sort(A):
    for j in range(1, len(A)):
        pass  # Do nothing

若使用quicksort，其运行过程如下：

A = [1,5,9,14,22,30,54,76,99]

第1次划分: q=8, A[p..q-1]=[1,5,9,14,22,30,54,76], A[q+1..r]=**null**

第2次划分: q=7, A[p..q-1]=[1,5,9,14,22,30,54], A[q+1..r]=**null**

第3次划分: q=6, A[p..q-1]=[1,5,9,14,22,30], A[q+1..r]=**null**

第4次划分: q=5, A[p..q-1]=[1,5,9,14,22], A[q+1..r]=**null**

...

第7次划分: q=2, A[p..q-1]=[1,5], A[q+1..r]=**null**

第8次划分: q=1, A[p..q-1]=[1], A[q+1..r]=**null**

可见该划分路径实际上是一条链，需要进行$\theta(n)$次划分，每次划分需要$\theta(n)$复杂度。因此quicksort总的时间复杂度为$\theta(n^2)$。

# 7.2-5

### 假设快速排序的每一层所作的划分的比例都是$1-\alpha:\alpha$，其中$0<\alpha \le 1/2$且是一个常数。试证明: 在相应的递归树中，叶结点的最小深度大约是$-lgn/lg\alpha$，最大深度大约是$-lgn/lg(1-\alpha)$（无需考虑整数舍入问题）。

根据换底公式，叶结点的最小深度是$\log _{a^{-1}}{n}$，最大深度是$\log _{{(1-a)}^{-1}}{n}$。$\alpha =0.1$时划分树如下：

![](fig7-4.png)

分析: 假设最小深度为$h_{min}$，最大深度为$h_{max}$。

在最小深度路径上，每次划分，元素的数量按$\alpha$比例减少，最终叶子结点处元素个数为1，即:

\begin{align}
&n*\alpha^{h_{min}}=1\\
\Rightarrow\ &\alpha^{h_{min}}=\frac{1}{n}\\
\Rightarrow\ &h_{min}\log _{2}{\alpha}=\log _{2}{\frac{1}{n}}\\
\Rightarrow\ &h_{min}=-\frac{\lg{n}}{\lg{\alpha}}=-\log _{\alpha}{n}=\log _{{\alpha}^{-1}}{n}
\end{align}

类似地，在最大深度路径上，每次划分，元素的数量按$1-\alpha$比例减少，最终叶子结点处元素个数为1，即:

\begin{align}
&n*(1-\alpha)^{h_{max}}=1\\
\Rightarrow\ &(1-\alpha)^{h_{max}}=\frac{1}{n}\\
\Rightarrow\ &h_{max}\log _{2}{(1-\alpha)}=\log _{2}{\frac{1}{n}}\\
\Rightarrow\ &h_{max}=-\frac{\lg{n}}{\lg{(1-\alpha)}}=-\log _{(1-\alpha)}{n}=\log _{{(1-\alpha)}^{-1}}{n}
\end{align}

# 7.2-6

### 试证明: 在一个随机输入数组上，对于任何常数$0<\alpha \le 1/2$，partition产生比$1-\alpha : \alpha$更平衡的划分的概率约为$1-2\alpha$

设X,Y分别为按照比例$1-\alpha:\alpha$划分的两个子集的元素数量(忽略A[q])，且$X+Y=n$。

根据"平衡"的定义，当$|X-Y|\rightarrow 0$时，划分越平衡；当$|X-Y|$越大时，划分越不平衡。

比$1-\alpha:\alpha$更平衡的划分应该满足:

\begin{align}
\alpha n < X < (1-\alpha)n\\
\alpha n < Y < (1-\alpha)n
\end{align}

则使得$|X-Y|$划分更平衡的数量差范围为: 

\begin{align}
0 \le |X-Y| < n - 2\alpha n 
\end{align}

概率为:

\begin{align}
0 \le \frac {|X-Y|}{n} < 1 - 2\alpha 
\end{align}