课前须知

课程主页 http://staff.ustc.edu.cn/~lszhuang

关于评分

期末考试（闭卷）+平时作业（按时交作业在原有基础+1分，作业也有考研算法部分 ~~，做了加分~~）+出勤（未到不扣分，到了加分）

提交作业在bb系统上面的网页系统（搭建的oj系统）

上机有3个实验，建议提前做

本课程不提供补考，只有重修

第一章算法分析技术

1.1 算法入门

1.1.1 课程学习背景

算法定义

考点

算法就是问题的程序化解决方案。它定义了一个良好的计算过程，取一个或者一组值作为输入，并产生出一个或者一组值作为输出。即：算法就是一系列的计算步骤，用来将输入数据转换成输出结果。

graph LR
A((输入)) --> B[计算过程< 算法 >]
B --> C((输出))

算法特征

考点

算法特征

问题与问题实例

考点

问题:规定了输入与输出之间的关系，可用通用语言来描述。
问题实例:某一个问题的实例包含了求解该问题所需的输入。

问题例子：

① 排序问题：将一系列数按非降顺序进行排序

输入: 由n个数组成的一个序列<𝒂𝟏,𝒂𝟐,…,𝒂𝒏 >
输出: 对输入系列的一个排列(重排) <𝒂𝟏,𝒂𝟐,…,𝒂𝒏>,使得𝒂𝟏≤𝒂𝟐≤ ⋯ ≤𝒂𝒏

② 一个实例：

Input: <31,41,59,26,41,58> —— Output:      <26,31,41,41,58,59>

重要问题类型：排序、字符串匹配、图搜索问题、几何问题、数值问题等。

输入实例与问题规模

考点

输入实例：问题的具体计算例子；
问题规模：算法的输入实例大小。如, 排序问题的3个输入实例:

① 13,5,6,37,8,92,12
② 43,5,23,76,25
③ 53,67,32,42,22,33,4,39,56
上面排序问题的3个输入实例的规模大小分别为7,5,9

正确算法与不正确算法

正确的算法

如果一个算法对问题每一个输入实例，都能输出正确的结果并停止，则称它为正确的。
不正确的算法
- ✓可能根本不会停止；
- ✓停止时给出的不是预期的结果；
- ✓如果算法的错误率可以控制，
- 也是有用的。

1.1.2 算法分析基础

问题求解与算法描述

问题求解过程

与真实代码差异
- ① 对特定算法的描述更加的清晰与精确；
- ② 不需要考虑太多技术细节（数据抽象、模块、错误处理等）；
- ③ 用伪代码可以体现算法本质；
- ④ 永远不会过时。
伪代码一些约定
- ① 书写上的“缩进”表示程序中的分程序（程序块）结构；
- ② 循环结构(while, for, repeat) 和条件结构 (if, then, else) 与Pascal, C语言类似；
- ③ “// ” or “►”来表示注释；
- ④ 利用i←j←e 来表示多重赋值，等价于 j←e 和i←j；
- ⑤ 变量是局部于给定过程的；
- ⑥ 数组元素的访问方式: A[i] ; A[1 .. j ] = < A[1], A[2],…, A[i]>
- ⑦ 符合数据一般组织成对象，由属性（attribute）或域(field)所组成；域的访问是由域名后跟方括号括住的对象名形式来表示, 如length[A]；
- ⑧ 参数采用按值传递方式；
- ⑨ 布尔操作 “and” 和“or”具有短路能力: 如 “x and (or) y ”: 无论y的值如何，必须首先计算x的值。

算法分析框架(import)

考点

示例:插入排序

考点

插入排序的主要思想:将未排序的最左端的元素(最开始从第二个元素开始)向左插入到该插入的位置，也就是将其插入到已经排好序的前几个元素中应该在的位置。这样遍历第二个元素到最后一个元素，就可以将元素进行排序。

问题描述（也叫形式化描述）

形式化描述通常包括问题描述、输入、输出和算法，一般简单问题可以只写前三个或者中间两个。

问题描述: 把一系列数据按非递增的顺序排列
输 入: n 个输入数<𝑎1,𝑎2,…,𝑎𝑛>
输 出: 输入系列的一个排序 <𝑎1,𝑎2,…,𝑎𝑛> , 使得𝑎1≤𝑎2≤⋯≤𝑎𝑛

算法

NSERTION-SORT(A)                                               cost times
1 for(j = 2; j <=length[A]; j++)                               c1   n
2 {   key = A[j]                                                c2   n-1
3     // Insert A[j] into the sorted sequence A[1 .. j-1]       0    n-1
4     i = j-1                                                   c4   n-1
5     while( i > 0 && A[i] > key)                               c5
6     { A[i+1] = A[i]                                           c6
7         i = i-1                                               c7
8     }
9     A[i+1] = key                                              c8   n-1
10 }

算法效率分析

考点

总时间效率

注: $t_j$ 为当第j轮执行for循环时，while语句需要执行的次数(重排前面排过序列的次数) $$T(n)=c_1 n+c_2 (n-1)+c_4 (n-1)+c_5 \sum\limits_{j=2}^n t_j +c_6 \sum\limits_{j=2}^n (t_j -1)+c_7 \sum\limits_{j=2}^n (t_j -1) +c_8 (n-1) $$
如果数组是排好序的，则会出现最好情况(此时只执行 $n$ 次 while 循环条件)： $$T(n)=c_1 n+c_2 (n-1)+c_4 (n-1)+c_5 (n-1) +c_8 (n-1)=(c_1 +c_2 +c_4 +c_5 +c_8)n–(c_2 +c_4 +c_5 +c_8))=an+b $$
如果数组是逆序排序的，则会出现最坏情况(此时 while 循环条件需要执行1,2,...,n次也就是将第i个元素一直向前移动知道其为第一位元素，循环内需要执行1,2,...,n-1次)： $$T(n)=c_1 n+c_2 (n-1)+c_4 (n-1)+c_5 \left(\frac{n(n+1)}{2}-1\right)+c_6 \left(\frac{n(n-1)}{2}\right)+c_7 \left(\frac{n(n-1)}{2}\right)+c_8 (n-1)=an^2+bn+3 $$

此时必须将每个元素A[j]与整个已排序的子数组A[1..j-1]中的每一个元素进行比较，对j=2,3,…,n,有 $t_j=j$ ,则有： $$\sum\limits_{j=2}^n j=\frac{n(n+1)}{2}-1，\sum\limits_{j=2}^n (j-1)=\frac{n(n-1)}{2} $$
平均时间此时见书可知，平均情况来说也就是 while 循环中A[j]与整个已排序的子数组A[1..j-1]中的一半元素进行比较，那么 $t_j$ 大概为 $j/2$ 。此时还是大概为输入规模 $n$ 的二次函数。

1.1.3 算法设计策略——分治法

概述

核心思想：分而治之，各个击破。
分治策略：

① 将原问题划分为n个规模较小而结构与原问题相似的子问题；

② 递归地解决这些子问题，然后再合并其结果，得到原问题解。
三个步骤

① 分解（Divide)：将原问题分成一系列子问题；

② 解决（Conquer)：递归求解各子问题。若子问题足够小，则直接求解；

③ 合并（Combine)：将子问题的结果合并成原问题的解。

示例：归并排序

归并排序算法(Merge sort algorithm)

考点

① 分解：把n个元素分成各含n/2个元素的子序列；

② 解决：用归并排序算法对两个子序列递归地排序；

③ 合并：合并两个已排序的子序列以得到排序结果。

graph TB
A[2 3 8 1 4 5 7 6] <--> B[2 3 8 1]
A <--> C[4 5 7 6]
B <--> D[2 3]
B <--> E[8 1]
C <--> F[4 5]
C <--> G[7 6]
D <--> H[2]
D <--> I[3]
E <--> J[8]
E <--> K[1]
F <--> L[4]
F <--> M[5]
G <--> N[7]
G <--> O[6]

对子序列排序时，其长度为1时递归结束。单个元素被视为是已排好序的。

关键步骤

MERGE(A, p, q, r)是关键步骤。

A是个数组，p, q, r 数组中元素的下标，且p ≤ q < r.
假设子数组 A[p .. q] 和 A[q+1 .. r]是有序的，将它们合并成一个已排好序的子数组代替当前子数组 A[p .. r]。
合并过程:

graph TB
A[        ?       ]
B[2 3 8 1] -->A
C[4 5 7 6] -->A

合并其实是同层(在此层下层处已经按照该步骤，将该层数组内元素的顺序排好了)合并至上层(父层)，先比较同层的2个子数组中第一个位置元素大小(分别为a，b)，按照排序规则放入上层第一个位置，假设为a，然后比较a所在子数组内的元素和b的大小，再进行放入第二个位置，以此类推排好上层元素顺序。

MERGE(A, p, q, r)算法伪代码

MERGE(A, p, q, r)                                       cost  times
1 n1 ← q-p+1                                             c    1
2 n2 ← r-q                                               c    1
3 create arrays L[1 .. n1+1] and R[1 .. n2+1]               c    1
4 for i←1 to n1                                          c    n1+1
5     do L[i]←A[p+i-1]                                    c    n1
6 for j←1 to n2                                          c    n2+1
7     do R[j]←A[q+j]                                     c    n2
8 L[n1+1]←∞          //设置哨兵元素                         c    1
9 R[n2+1]←∞          //设置哨兵元素                         c    1
10 i←1                                                  c    1
11 j←1                                                  c    1
12 for k←p to r                                          c    r-p+2
13    do if L[i]≤R[j]                                    c    r-p+1
14        then A[k]←L[i]                                 c    x
15            i←i+1                                      c    x        
16        else A[k]←R[j]                                c    r-p+1-x
17            j←j+1                                     c    r-p+1-x

时间复杂度： $$𝜃(𝑛_1 + 𝑛_2)= 𝜃(𝑛)$$
递归算法

MERGE-SORT(A, p, r)
1 if p < r
2     Then 𝑞 ← (𝑝 + 𝑟)/2
3         MERGE-SORT(A, p, q)
4         MERGE-SORT(A, q+1, r)
5 MERGE(A, p, q, r)

graph TB
B[2 3 8 1] --> D[2 3]
B --> E[8 1]
D <--> H[2]
D <--> I[3]
E <--> J[8]
E <--> K[1]
A[2 3 8 1]
C[2 3] --> A
F[1 8] --> A
G[2] --> C
L[3]--> C
M[8] --> F
N[1] --> F

分支法分析

分治法时间复杂度

考点

$$ T(n)= \begin{cases} Θ(1), & \text{if } n \geq c \newline aT(n/b)+D(n)+C(n), & \text{otherwise } \end{cases} $$

➢ D(n)是把原问题分解为子问题所花的时间；

➢ C(n)是把子问题的解合并为原问题的解所花的时间；

➢ T(n)是一个规模为n的问题的运行时间，a和b可认为将规模n分解为a个规模为n/b的问题。

为简化算法分析，通常假设n为2的幂次，使得每次分解产生的子序列长度恰为n/2。这一假设并不影响递归式解的增长量级。

归并排序最坏运行时间

① 当n=1时，合并排序一个元素的时间是个常量；
② 当n>1时，运行时间分解如下：

➢ 分解：仅仅是计算出子数组的中间位置，需要常量时间，D(n)=Θ(1)；

➢ 解决：递归地求解两个规模为n/2的子问题，时间为2T(n/2)；

➢ 合并：MERGE过程的运行时间为C(n)=Θ(n)。

$$ T(n)= \begin{cases} Θ(1), & \text{if } n =1 \newline 2T(n/2)+Θ(n), & \text{if } n >1 \end{cases} $$

归并排序时间复杂度求解

递归式重写

$$ T(n)= \begin{cases} Θ(1), & \text{if } n =1 \newline 2T(n/2)+Θ(n), & \text{if } n >1 \end{cases} →T(n)= \begin{cases} Θ(1), & \text{if } n =1 \newline 2T(n/2)+cn, & \text{if } n >1 \end{cases} $$

递归式求解(分治法也就是把问题变成一个树的形式进行递归，第 $i$ 层的节点数为 $2^i$ 个) $$cn(\lg n+1)=cn\lg n+cn=Θ(n\lg n)$$
其中：
- 每一层总代价: $2^i c(n/2^i)=cn$
  
  即为一个树状图，每层有 $2^i$ 个，每个的运行时间为 $c(n/2^i)$ 。这是因为输入规模为 $n$ 的时间花销为 $c$ 所以对于第 $i$ 层节点只有输入规模只有 $n/2^i$ ，故代价为 $c(n/2^i)$ 。
- 树的总层数: $\lg n+1$
  
  推导：假设树的总层数为d，则根据等比数列1,2,4,..., $2^d$ 的求和所得 $2^{d+1}-1$ ,则有不等式 $2^{d}-1 \leq n \leq 2^{d+1}-1$ ,求解不等式后可得 $d\approx\lg n+1$
- 所以总共时间复杂度为树的总层数乘以每层的花销。

1.2 函数增长

1.2.1 渐进记号

渐进记号

函数的增长量级

用于简单地刻画算法效率，舍弃了低阶项和高阶项的系数。
函数的渐近效率

当输入规模无限增加时，描述了算法的运行时间如何随着输入规模的变大而增加。也就是，描述函数的渐近增长行为。
渐近记号

用来描述算法渐近运行时间的渐近界，主要用于简化算法的渐近分析。本质上，渐近记号作用于定义域为自然数集N={0,1,2,…}的函数上，代表了一个函数集合。 $$o\approx <;O\approx \leq; \Theta\approx =;\Omega\approx \geq;\omega\approx >$$

Θ记号：渐近紧界（asymptotically tight bound）

考点

定义

𝜽(𝒈(𝒏))定义：

对给定函数 $𝑔(𝑛)，𝜃(𝑔(𝑛))$ 表示以下函数的集合： $$𝜃(𝑔(𝑛))= \lbrace 𝑓(𝑛):∃正常数𝑐_1,𝑐_2,𝑛_0,∀𝑛 ≥ 𝑛_0,有0 ≤ 𝑐_1𝑔(𝑛)≤𝑓(𝑛)≤𝑐_2𝑔(𝑛)\rbrace$$ 类似 夹逼定理 。
说明：

① 𝑔(𝑛)是𝑓(𝑛)的一个渐近紧确界；

② 𝜃(𝑔(𝑛))定义要求每个成员𝑓(𝑛)均渐近非负，𝑔(𝑛)本身也渐近非负。本课程后面应用于渐近记号的函数均认为满足该假设；

③ 𝑓(𝑛)∈ 𝜃(𝑔(𝑛))表示𝑓(𝑛)是𝜃(𝑔(𝑛))的成员，可以简写为𝑓(𝑛)= 𝜃(𝑔(𝑛)) 。

举例

例子1：证明 $\frac{n^2}{2}-3n=\theta(n^2)$

证明：假设 $∃c_1,c_2和n_0$ ,使得 $∀𝑛 ≥ 𝑛_0$ ,有 $c_1 n^2 \leq\frac{n^2}{2}-3n \leq c_2n^2$

⟹ $c_1 \leq\frac{1}{2}-\frac{3}{n}\leq c_2$ 当𝑛 → ∞时，可以得到 $c_1 \leq\frac{1}{2},c_2\geq\frac{1}{2}$ 。

取 $c_1=\frac{1}{14},c_2=\frac{1}{2}$ ,以及 $n_0=7$ ,可以证明 $\frac{n^2}{2}-3n=\theta(n^2)$

例子2：证明 $6n^3\neq\theta(n^2)$

证明：(反证法)

假设 $∃c_2 >0,n_0 >0$ 使得所有的 $n>n_0$ ,由 $6n^3\leq\theta(n^2)$ 。

也就是说,对于所有 $n\geq n_0$ 都有 $n\leq c_2/6$ 成立,而不等式的右边是个常数，显然不可能对任意大的𝑛成立。

关于渐进紧界

通常情况下，可以把一个函数的低阶项和高阶项系数忽略，从而得到函数的渐近紧界。

比如: $f(n)=an^2+bn+c$ ,其中，a>0,b,c为常量，则有 $f(n)=\theta (n^2)$ 。
一般情况下，对任意的多项式 $p(n)=\sum\limits_{i=0}^d a_in^i$ ,其中 $a_i$ 是常数且 $a_d>0$ , 我们有 $𝒑(𝒏)=\theta (𝒏^d)$ 。
任意常数函数都可以用渐近符号 $\theta (𝒏^𝟎)$ 或 $\theta (𝟏)$ 来表示，通常利用 $\theta (𝟏)$ 来表示常数或者常数函数。

𝑂记号：渐近上界（asymptotically upper bound）

考点

𝑂(𝒈(𝒏))定义

对给定函数𝑔(𝑛)，𝑂(𝒈(𝒏))表示以下函数的集合： $$𝑂(𝑔(𝑛)) = \lbrace 𝑓(𝑛) :∃正常数𝑐, 𝑛_0 > 0，∀𝑛 ≥ 𝑛_0,有0 ≤ 𝑓(𝑛) ≤ 𝑐𝑔(𝑛)\rbrace$$

理解为𝑓(n)一直向上趋近于𝑔(𝑛)

关于渐进上界的说明

𝑓(𝑛)=𝑂(𝑔(𝑛))说明

𝑔(𝑛)是𝑓(𝑛)的一个 渐近上界 ；
每个成员𝑓(𝑛)均渐近非负，𝑔(𝑛)本身也渐近非负；
𝑓(𝑛)= 𝑂(𝑔(𝑛)) 等价于𝑓(𝑛)∈ 𝑂(𝑔(𝑛))，意味着𝑓(𝑛)是集合𝑂(𝑔(𝑛))的成员;
如果𝑓(𝑛)=𝜃(𝑔(𝑛)) ，则𝑓(𝑛)=𝑂(𝑔(𝑛))，𝜃(𝑔(𝑛))=𝑂(𝑔(𝑛))，反之不成立。

$𝑂(n^2)$ 函数举例

$an^2+bn+c$ , $an$ , $n^{1.9999}$ , $n^2 / \lg \lg \lg n$

𝜴记号：渐近下界(asymptotically lower bound)

考点

𝜴(𝒈(𝒏))定义

对给定函数𝑔(𝑛)，𝛺(𝑔(𝑛))表示以下函数的集合： $$𝛺(𝑔(𝑛))=\lbrace 𝑓(𝑛):∃正常数𝑐, 𝑛_0 > 0，∀𝑛 ≥ 𝑛_0,有0 ≤ 𝑐𝑔(𝑛)≤𝑓(𝑛)\rbrace$$

理解为𝑓(n)一直向下趋近于𝑔(𝑛)

关于渐进下界的说明

𝑓(𝑛)=𝛺(𝑔(𝑛))说明

𝑔(𝑛)是𝑓(𝑛)的一个 渐近下界 ；
每个成员𝑓(𝑛)均渐近非负，𝑔(𝑛)本身也渐近非负；
𝑓(𝑛)= 𝛺(𝑔(𝑛)) 等价于𝑓(𝑛)∈ 𝛺(𝑔(𝑛))，意味着𝑓(𝑛)是集合𝛺(𝑔(𝑛))的成员;
如果𝑓(𝑛)=𝜃(𝑔(𝑛)) ，则𝑓(𝑛)=𝛺(𝑔(𝑛))，𝜃(𝑔(𝑛))=𝛺(𝑔(𝑛))，反之不成立。

$𝛺(n^2)$ 函数举例

$an^2+bn+c$ , $n^3$ , $n^{2.000001}$ , $n^2 \lg \lg \lg n$

定理1.3.1

对任意两个函数𝒇(𝒏)和𝒈(𝒏)，有𝒇(𝒏)=𝜽(𝒈(𝒏))当且仅当𝒇(𝒏)=𝑶(𝒈(𝒏))且𝒇(𝒏)=𝜴(𝒈(𝒏))同时成立。

证明:

→ $𝒇(𝒏)=𝜽(𝒈(𝒏)),then \ ∃c_2>0,c_2>0,n_0>0,$

$s.t. \ n \geq n_0,0 \leq c_1𝒈(𝒏) \leq 𝒇(𝒏) \leq c_2𝒈(𝒏)$

$then \ n \geq n_0,0 \leq 𝒇(𝒏) \leq c_2𝒈(𝒏)⟹ 𝒇(𝒏)=𝑶(𝒈(𝒏))$

$then \ n \geq n_0,0 \leq c_1𝒈(𝒏) \leq 𝒇(𝒏)⟹ 𝒇(𝒏)=𝜴(𝒈(𝒏))$

← $𝒇(𝒏)=𝑶(𝒈(𝒏)),then \ ∃c_2>0,c_{20}>0,n_{20}>0,$

$s.t. n \geq n_{20},0 \leq 𝒇(𝒏) \leq c_{20}𝒈(𝒏)$

$𝒇(𝒏)=𝜴(𝒈(𝒏)),then \ ∃c_2>0,c_{10}>0,n_{10}>0,$

$s.t. n \geq n_{10},0 \leq c_{20}𝒈(𝒏) \leq 𝒇(𝒏)$

$let \ n_0=max\lbrace n_{10},n_{20}\rbrace,then \ n \geq n_0$

$0\leq c_{10}𝒈(𝒏) \leq 𝒇(𝒏)\leq c_{20}𝒈(𝒏),that \ is \ 𝒇(𝒏)=𝜽(𝒈(𝒏))$

关于渐进上界和下界某些说明

算法的运行时间为𝑂(𝑔(𝑛))意味着：当𝑛足够大时，对输入规模为𝑛的任意输入，其运算时间至多是𝑔(𝑛)的一个常数倍；
算法的运行时间为𝜴(𝑔(𝑛))意味着：当𝑛足够大时，对输入规模为𝑛的任意输入，其运算时间至少是𝑔(𝑛)的一个常数倍；
部分问题：

✓ 插入排序的算法运行时间为 $𝑂(𝑛^2)$ ？还是 $𝜴(𝑛^2)$ ？还是 $𝜃(𝑛^2)$ ？

这个问题的答案应该是要分开回答的，一般最坏情况运行时间为 $𝑂(𝑛^2)$ ，平均运行时间认为是 $𝜃(𝑛^2)$ ，最好情况运行时间为 $𝜴(𝑛^2)$ ,但是一般说插入排序算法运行时间为 $𝜃(𝑛^2)$ ，即说平均时间，这样是准确的且有意义的。

✓ 插入排序的算法最坏运行时间为 $𝑂(𝑛^2)$ ？还是 $𝜴(𝑛^2)$ ？还是 $𝜃(𝑛^2)$ ？

$𝑂(𝑛^2)$ ,表示在最坏情况下，它的运行时间是二次多项式级别的最好运行情况为 $𝜴(𝑛)$ 。

✓ 如果说一个算法的运行时间不超过 $𝜴(𝑛^2)$ ，这是否有矛盾？为什么？

说一个算法的运行时间不超过 $𝜴(𝑛^2)$ 没有矛盾，因为这也是一个上界条件，但是这个说法是无意义的，因为 $𝜴(𝑛^2)$ 一般为渐进下界，所以说最差运行时间为 $𝜴(𝑛^2)$ ，会有很大范围浮动，是一个不精确的表述，所以是无意义的。

等式和不等式中的渐近记号

如何解释：“𝒏 = $𝑶(𝒏^2)$ ”,” $𝟐𝒏^𝟐 + 𝟑𝒏 + 𝟏 = 𝟐𝒏^2+ 𝜽(𝒏)$ ”, …
- 渐近记号单独在等式的右侧，比如𝑛 = $𝑂(𝑛^2)$ ，这表示左侧函数属于右侧集合的一个成员，即 $𝑛 ∈ 𝑂(𝑛^2)$;
- 渐近记号出现在一个公式的内部，比如” $2𝑛^2 + 3𝑛 + 1 = 2𝑛^2 + 𝜃(𝑛)$ ”表示存在某个匿名函数𝑓(𝑛)使得” $2𝑛^2 + 3𝑛 + 1 = 2𝑛^2 + 𝑓(𝑛)$ ”成立，其中𝑓(𝑛)∈ 𝜃(𝑛)；
- 渐近记号出现在等式的左侧，可以被解释为无论怎样从左侧渐近记号表示的集合中选择成员，总是可以从右侧的渐近记号表示的集合中选择某个成员使得等式成立。例如“ $2𝑛^2 + 𝜃(𝑛)= 𝜃(𝑛^2)$” 可解释为任给𝑓(𝑛)∈ 𝜃(𝑛)，存在𝑔(𝑛)∈ $𝜃(𝑛^2)$ ，使等式成立。
因此，可以列出等式” $𝟐𝒏^𝟐 + 𝟑𝒏 + 𝟏 = 𝟐𝒏^𝟐 + 𝜽(𝒏) = 𝜽(𝒏^𝟐)$ ”.

o记号：非渐近紧确上界

𝑂(𝑔(𝑛))的局限性：

如：2𝑛 = 𝑂(𝑛)是渐近紧确的，但是 $2𝑛 = 𝑂(𝑛^2)$ 不是渐近紧确的。
𝒐(𝒈(𝒏))表示一个非渐近紧确上界：

对给定函数𝑔(𝑛)，𝑜(𝑔(𝑛))表示以下函数的集合：

$𝑜(𝑔(𝑛))=\lbrace 𝑓(𝑛):对于任意正常数𝑐, ∃𝑛_0> 0，∀𝑛 ≥ 𝑛_0,有0 ≤ 𝑓(𝑛) < 𝑐𝑔(𝑛) \rbrace$

例， $2𝑛 = 𝑜(𝑛^2)$ ，但是 $2𝑛^2 ≠ 𝑜(𝑛^2)$ 。

也就是右侧不能取等下同

ω记号：非渐近紧确下界

Ω(𝑔(𝑛))的局限性：

如： $2𝑛^2 = 𝛺(𝑛^2)$ 是渐近紧确的，但是 $2𝑛^2 = 𝛺(𝑛)$ 不是渐近紧确的。
𝝎(𝒈(𝒏))表示一个非渐近紧确下界：

对给定函数𝑔(𝑛)，𝜔(𝑔(𝑛))表示以下函数的集合：

$𝜔(𝑔(𝑛))=\lbrace𝑓(𝑛):对于任意正常数𝑐, ∃𝑛_0> 0，∀𝑛 ≥ 𝑛_0,有0 ≤ 𝑐𝑔(𝑛) < 𝑓(𝑛)\rbrace$

例， $2𝑛^2 = ω(𝑛)$ ，但是 $2𝑛^2 ≠ ω(𝑛^2)$ 。
𝒇(𝒏)= 𝝎(𝒈(𝒏)) 当且仅当𝑔(𝑛)=𝑜(𝑓(𝑛))成立，存在极限： $\lim\limits_{n \to \infty} \frac{𝑓(𝑛)}{𝑔(𝑛)} = \infty$

函数比较

传递性

$𝒇(𝒏)=\theta (𝑔(𝑛)) \ and \ 𝑔(𝑛)=\theta (h(𝑛)) \ imply \ 𝒇(𝒏)=\theta (h(𝑛))$

$𝒇(𝒏)=O(𝑔(𝑛)) \ and \ 𝑔(𝑛)=O(h(𝑛)) \ imply \ 𝒇(𝒏)=O(h(𝑛))$

$𝒇(𝒏)=\Omega(𝑔(𝑛)) \ and \ 𝑔(𝑛)=\Omega (h(𝑛)) \ imply \ 𝒇(𝒏)=\Omega (h(𝑛))$

$𝒇(𝒏)=o(𝑔(𝑛)) \ and \ 𝑔(𝑛)=o(h(𝑛)) \ imply \ 𝒇(𝒏)=o(h(𝑛))$

$𝒇(𝒏)=w(𝑔(𝑛)) \ and \ 𝑔(𝑛)=w(h(𝑛)) \ imply \ 𝒇(𝒏)=w(h(𝑛))$
对称性

$𝒇(𝒏)=\theta (𝑔(𝑛)) \ if \ and \ only \ if \ 𝑔(𝑛)=\theta (𝒇(𝒏))$
反对称性

$𝒇(𝒏)=O(𝑔(𝑛)) \ if \ and \ only \ if \ 𝑔(𝑛)=\Omega (𝑔(𝒏))$

$𝒇(𝒏)=\Omega (𝑔(𝑛)) \ if \ and \ only \ if \ 𝑔(𝑛)=O(𝑔(𝒏))$
自反性

$𝒇(𝒏)=\theta (𝒇(𝒏))$

$𝒇(𝒏)=O(𝒇(𝒏))$

$𝒇(𝒏)=\Omega(𝒇(𝒏))$
与实数比较进行类比

$𝒇(𝒏)=o(𝑔(𝑛)) \approx a < b$

$𝒇(𝒏)==O(𝑔(𝑛)) \approx a \leq b$

$𝒇(𝒏)=\theta (𝑔(𝑛)) \approx a=b$

$𝒇(𝒏)=\Omega(𝑔(𝑛)) \approx a \geq b$

$𝒇(𝒏)=w(𝑔(𝑛)) \approx a > b$
实数的三分性定理

任意两个实数 𝑎 和 𝑏, 它们的大小关系必然满足三种关系的其中之一: 𝑎 < 𝑏, 𝑎 = 𝑏 或𝑎 > 𝑏。
不是所有的函数都是渐近可比较的，比如：

函数 $𝑓(𝑛)= 𝑛^{1+𝑠𝑖𝑛𝑛}$ 和函数 $𝑔(𝑛)=𝑛$ 就无法用渐近记号相互比较！

$-1 \leq sinn \leq 1⟹n^0 \leq n^{1+𝑠𝑖𝑛𝑛} \leq n^2$

$n^{1+𝑠𝑖𝑛𝑛} \leq n \leq n^{1+𝑠𝑖𝑛𝑛} ,矛盾$

1.2.2 常用函数

标准记号与常用函数

考点

下取整与上取整(Floors and ceilings) $$x-1 < \lfloor x \rfloor \leq x \leq \lceil x \rceil < x+1$$
模运算(Modular arithmetic) $$a \ mod \ n=a- \lfloor a/n \rfloor n$$
多项式(Polynomials) $$p(n)=\sum\limits_{i=0}^d a_in^i$$
指数(Exponentials)
对数(Logarithms)
阶乘(Factorials)

斯特林近似公式 ，考试会给出来，不用特地记

$$n!=\sqrt{2\pi n}\left(\frac{n}{e}\right)^n\left(1+\theta\left(\frac{1}{n}\right)\right)$$ $$⟹n!=o(n^n),n!=w(2^n),\lg (n!)=\theta (n\lg n)$$

迭代函数(Functional iteration)

使用记号 $𝑓^{(𝑖)}(𝑛)$ 来表示函数𝑓(𝑛)使用初始值𝑛进行迭代𝑖次后的结果。对非负的𝑖，递归地定义

$$ 𝑓^{(𝑖)}(𝑛)= \begin{cases} n, & \text{if } i =0 \newline 𝑓(𝑓^{(i-1)}(n)), & \text{if } i >0 \end{cases} $$

假设𝑓(𝑛)= 2𝑛，那么

$$𝑓^{(2)}(𝑛)=𝑓(𝑓(𝑛))=𝑓(2𝑛)=2(2n)=2^2n$$

$$...$$

$$𝑓^{(𝑖)}(𝑛)=2^in$$

多重对数函数（The iterated logarithm function）

使用记号lg*n来表示。令 $\lg ^{(𝑖)} 𝑛$ 为之前定义的迭代函数,其中𝑓(𝑛)=𝑙𝑔𝑛,即 $\lg ^{(𝑖)} 𝑛 = \lg(\lg ^{(𝑖−1)}(𝑛))$ 。 $\lg ^{(𝑖)} 𝑛$ 有定义仅当 $\lg ^{(𝑖−1)} 𝑛 > 0$ 。注意区分 $\lg^{(𝑖)} 𝑛$ 与 $\lg ^𝑖 𝑛$ 。

$$\lg^*n 被定义为：\lg^*n=min\lbrace i \geq 0:\lg^{(i)}n \leq 1\rbrace$$

多重对数函数是一个增长十分缓慢的函数：

$$\lg^*2=1,\lg^*4=2,\lg^*16=3,\lg^*65536=4,\lg^*2^65536=5$$

$2^{65536}>>10^{80}$ ,极少会遇到使 $\lg ^* n>5$

斐波那契数（Fibonacci numbers）

1.2.3 级数求和

考点

级数求和

定义：有限和、无限和、级数收敛、级数发散的、绝对收敛级数
等差级数： $\sum\limits_{k=1}^n k=1+2+...+n=\frac{1}{2}n(n+1)=\theta (n^2)$
平方和与立方和： $\sum\limits_{k=0}^n k^2=\frac{n(n+1)(2n+1)}{6}$ , $\sum\limits_{k=0}^n k^3=\frac{n^2(n+1)^2}{4}$
几何级数： $\sum\limits_{k=0}^n x^k=1+x+x^2+...+x^n=\frac{x^{n+1}-1}{x-1}$
调和级数： $H_n=1+\frac{1}{2}+\frac{1}{3}+...+\frac{1}{n}=\sum\limits_{k=1}^n \frac{1}{k}=\ln n+O(1)$
级数的积分和微分： $\sum\limits_{k=0}^{\infty}kx^k=\frac{x}{(1-x)^2}$

确定求和时间的界

数学归纳法

计算级数的准确值
计算和式的界，如：证明几何级数 $\sum\limits_{k=1}^n3^k$ 的界是 $O(3^n)$
一个容易犯的错误，如：证明 $\sum\limits_{k=1}^nk=O(n)$

确定级数各项的界

一个级数的理想上界可以通过对级数中的每个项求界来获得；
一个级数实际上以一个几何级数为界时，可以选择级数的最大项作为每项的界（注意防止犯错！）

分割求和：可以将级数表示为两个或多个级数，按下标的范围进行划分，然后再对每个级数分别求界。

1.3 递归式求解

1.3.1 代换法

引言

递归式: 是一组等式或不等式，用更小输入下该函数的值来定义自身。

$$ T(n)= \begin{cases} 1, & \text{if } n =1 \newline 2T\left(\frac{n}{2}\right)+n, & \text{if } n >1 \end{cases} $$

一些细节：

假设函数自变量为整数，忽略上取整和下取整，如：

$$ T(n)= \begin{cases} \theta (1), & \text{if } n =1 \newline T\left(\lceil\frac{n}{2}\rceil\right)+T\left(\lfloor\frac{n}{2}\rfloor\right)+\theta (n), & \text{if } n >1 \end{cases} $$

忽略递归式的边界条件，并假设对于小的n值，T(n)是常量，如下就忽略该情况。

$$ T(n)=2T\left(\frac{n}{2}\right)+\theta (n) $$

递归式求解方法：

A. 代换法(替换法)：先猜有某个解存在，用数学归纳法证明猜测的正确性；

B. 迭代法：把递归式转化为求和表达式，然后求和式的界；

C. 递归树法：直观地表达了迭代法；

D. 主方法：给出求解𝑇(𝑛)=𝑎𝑇(𝑛/𝑏)+𝑓(𝑛)这种形式递归式的简单方法。

代换法

考点

代换法求解步骤：

① 先猜测解的基本形式

② 用数学归纳法证明猜测的正确性

A. 先证明一般情况成立

B. 再考虑边界条件

猜测法

考点

示例

求解T(n)的表达式

$$ T(n)= \begin{cases} 1, & \text{if } n =1 \newline 2T\left(\frac{n}{2}\right)+n, & \text{if } n >1 \end{cases} $$

答案1

① 猜测问题的解是 𝑇(𝑛) = 𝑛lgn + 𝑛 。

② 归纳证明：

A. 当𝑛 = 1时， 𝑇(1)= 𝑛lg𝑛 + 𝑛 = 1 成立；

B. 假设 ∀𝑘 < 𝑛 时，有 𝑇(𝑘) = 𝑘lg𝑘 + 𝑘 。当𝑘 ≥ 𝑛时，有：

$T(n)=2T\left(\frac{n}{2}\right)+n$ $=2[\left(\frac{n}{2}\right)+\lg \left(\frac{n}{2}\right)+\frac{n}{2}]+n$ ( 归纳假设 ) $=n\lg \left(\frac{n}{2}\right)+n+n$ $=n(\lg n-\lg 2)+2n$ $=𝑛lg𝑛 + 𝑛$

答案2

① 猜测问题的解是 𝑇(𝑛) = 𝑶(𝑛lgn) 。

② 证明𝑇(𝑛)≤ 𝑐𝑛lg𝑛 对某正常量𝑐, $𝑛_0$ 成立。

A. 假设该不等式关系对𝑘 < 𝑛 成立，则有 $$T\left(\frac{n}{2}\right)\leq \frac{cn}{2}\lg \frac{n}{2}$$ B.当𝑘 ≥ 𝑛时，有：

$T(n)=2T\left(\frac{n}{2}\right)+n \leq cn\lg \frac{n}{2}+n$ $=cn\lg n-cn\lg 2+n$ $≤ 𝑐𝑛\lg 𝑛 ， ∀𝑐 \geq 1$

C. 当𝒏 = 𝟏时，𝑻(𝟏) ≤ 𝟎, 与边界条件矛盾！！！ (此时更改边界条件，也就是更改 $n_0，c$ 取值使得边界条件成立就行)

D. 所以取 $n_0=2$ ,c=1时，上述结论成立，证毕，也就是 $T(1)=1,n>1,T(n)=𝑶(𝑛lgn)$

注：总结： 如果归纳假设与边界条件不一致，可以设立新的边界条件使得归纳证明成立。

如何做一个好的猜测？

一般通过非递归部分进行猜测，一般非递归部分更上一级就为结果，比如非递归部分为 $+ \theta(n^2)$ ，则猜测结果为 $O(n^2)$ ，如果为常数就猜测为 $O(n)$ ，如果为 $+n$ 就猜测为 $O(nlgn)$ 。但是这个一般与递归部分也有关系，此处只提供一个大致的猜测方向

$$ T(n)=T\left(\lceil\frac{n}{2}\rceil\right)+T\left(\lfloor\frac{n}{2}\rfloor\right)+1 $$

解：首先，猜测解为T(n)=𝑂(𝑛) ；

然后，证明𝑇(𝑛)≤𝑐𝑛对某正常数𝑐, $𝑛_0$ 成立。

A. 假设该结论对𝑘 < 𝑛成立，则有

$T\left(\lceil\frac{n}{2}\rceil\right)\leq c\lceil\frac{n}{2}\rceil$ , $T\left(\lfloor\frac{n}{2}\rfloor\right)\leq c\lfloor\frac{n}{2}\rfloor$

B. 当𝑘 ≥ 𝑛时，则有

$T(n) \leq c\lceil\frac{n}{2}\rceil+c\lfloor\frac{n}{2}\rfloor+1 \leq cn+1$

这对任意𝒄都不意味着 𝑇(𝑛)≤𝑐𝑛 ,怎么处理？

预证结论：𝑇(𝑛)≤ 𝑐𝑛
推导结果：𝑇(𝑛)≤ 𝑐𝑛 + 1

↓

解决方案：可以通过对更小的值假设更强的条件，对于一个给定值证明更强的结论(说直白也就是对假设中渐近界限表达式中加上一个常数或者减去一个常数)。

↓

解：首先，猜测解为T(n)=𝑂(𝑛) ；

然后，证明𝑇(𝑛)≤𝑐𝑛-a对某正常数𝑐, $𝑛_0$ 成立。

A. 假设该结论对𝑘 < 𝑛成立，则有

$T\left(\lceil\frac{n}{2}\rceil\right)\leq c\lceil\frac{n}{2}\rceil -a$ , $T\left(\lfloor\frac{n}{2}\rfloor\right)\leq c\lfloor\frac{n}{2}\rfloor -a$

B. 当𝑘 ≥ 𝑛时，则有

$T(n) \leq c\lceil\frac{n}{2}\rceil -a+c\lfloor\frac{n}{2}\rfloor -a+1 \leq cn+1$

$\leq cn-2a+1$

$\leq cn-a,((∀𝑎 \geq 1都成立)$

$\leq cn$

$因此，当𝒄 = 𝟏, 𝒏_𝟎 = 𝟏可证明𝑻(𝒏) ≤ 𝒄𝒏成立。$

关于部分陷阱

避免陷阱：

$T(n)=2T\left(\lfloor\frac{n}{2}\rfloor\right)+1$

解：首先，猜测解为T(n)=𝑂(𝑛) ；

然后，证明𝑇(𝑛)≤𝑐𝑛对某正常数𝑐, $𝑛_0$ 成立。

A. 假设该结论对𝑘 < 𝑛成立，则有

$T\left(\lfloor\frac{n}{2}\rfloor\right)\leq c\lfloor\frac{n}{2}\rfloor$

B. 当𝑘 ≥ 𝑛时，有

$T(n) \leq 2c\lfloor\frac{n}{2}\rfloor+n \leq cn+n=O(n)$

证毕。

错误！因为没有证明出与归纳假设严格一致的形式！，说直白也就是没有把结果写成小于等于cn的形式，因为刚开始假设证明𝑇(𝑛)≤𝑐𝑛成立后面结果证明的是𝑇(𝑛)≤𝑐𝑛+n所以是有问题的。

改变变量法

考点

$$T(n)=2T(\sqrt n)+\lg n$$

解：令m=lgn，则有 $T(2^m)=2T(2^{\frac{m}{2}})+m$

令 $S(m)=T(2^m)$ ,则原递归式可以转为： $S(m)=2S(\frac{m}{2})+m$

上面递归式与之前例题相似有相同的解: $S(m)=O(mlgm)$

最后将变量变换回去得到： $T(n)=T(2^m)=O(mlgm)=O(lgnlglgn)$

1.3.2 迭代法

考点

核心思路：扩展（迭代）原递归式并将其表示成更小的项以及初始条件的累和的形式。

展开法

考点

举例

$T(n)=3T(\lfloor\frac{n}{4}\rfloor)+n=n+3T(\lfloor\frac{n}{4}\rfloor)$ $=n+3(\lfloor\frac{n}{4}\rfloor+3T(\lfloor\frac{n}{4^2}\rfloor))$ $=n+3\lfloor\frac{n}{4}\rfloor+3^2(\lfloor\frac{n}{4^2}\rfloor+3T(\lfloor\frac{n}{4^3}\rfloor))$ $=n+3\lfloor\frac{n}{4}\rfloor+3^2\lfloor\frac{n}{4^2}\rfloor+3^3(\lfloor\frac{n}{4^3}\rfloor+3T(\lfloor\frac{n}{4^4}\rfloor))$ $=...$ $=n+\sum\limits_{i=1}^k (3^i\lfloor\frac{n}{4^i}\rfloor)$ $=？$

展开终止条件：当子问题规模达到边界条件时, $\lfloor\frac{n}{4^i}\rfloor$ =1时迭代终止。

考虑到 $\lfloor\frac{n}{4^i}\rfloor \leq \frac{n}{4^i}$ ，可以得到下面递减的等比级数：

$T(n)=3T(\lfloor\frac{n}{4}\rfloor)+n=n+\sum\limits_{i=1}^k (3^i\lfloor\frac{n}{4^i}\rfloor)$

$\leq n+\sum\limits_{i=1}^k (3^i*\frac{n}{4^i})=n\sum\limits_{i=1}^k\left(\frac{3}{4}\right)^i$

$\leq n\sum\limits_{i=1}^{\infty}\left(\frac{3}{4}\right)^i=4n$

$=O(n)$

关于迭代法的某些处理

迭代法一般会导致较多的代数计算，关键在于：

递归的次数需要满足将递归展开到边界条件(一般都是迭代到实例规模为1)；（递归次数）

级数的求解从每一层的迭代中得到。（级数求和）
用于辅助解猜测时 ，如果可以根据猜测得到最终的解，则不需要写出完整数学形式，转而使用代换法来证明猜测的结果。
对于上取整/下取整的处理 $$T(n)=3T(\lfloor \frac{n}{4}\rfloor)+n$$

为了方便处理，可以假设𝑛 = $4^𝑘$, 其中𝑘是某整数。

递归树法

考点

核心思路：在递归树种，每个结点表示一个单一子问题的代价，子问题对应某次递归函数调用。将树中每层中的代价求和，得到每层代价，然后将所有层的代价求和，得到所有层次的递归调用的总代价。

直白来说，可以根据递归式写出该递归树，只看递归部分的系数，也就是每个节点的子节点数，也就是其子节点数等于该节点的贡献数即系数，递归部分中的分数也就是每层节点的实例规模是其父节点示例规模的多少分之一。而非递归部分可以用于猜测递归式最终的表达式，比如 $+\theta(n)$ 可猜测最终表达式与 $cn$ 有关系。并将第一层，也就是根节点的代价认为为 $cn$ 。树的层数一般为 $\log_b n$ (假设 $T(n)=aT(\frac{n}{b})+...$)，也就是通过等比数列求和得出来的结果，因为最终的递归边界为实例规模为1，则假设树层数为 $d$ ，则有 $\frac{n}{b^d}=1$ ， $d=\log_b n$ 。则最后一层规模为1，则最后一层代价为 $\theta (节点数)$ ，一般均为 $\theta (n^{\log_a b})$ (最后一层规模为1，所以每一个节点代价为c)。

举例

$T(n)=3T(n/4)+\theta(n^2)$

𝑇(𝑛)=3𝑇(𝑛/4)+𝜃(𝑛²)的递归树

$T(n)=T(n/3)+T(2n/3)+O(n)$

渐近上界： $𝑇(𝑛)≤ 𝑐𝑛 × \log{\frac{2}{3}}{𝑛} = 𝑂(𝑛 \lg 𝑛)$

渐近下界： $𝑇(𝑛)≥ 𝑐𝑛 × \log{\frac{1}{3}}{𝑛} = Ω(𝑛 \lg 𝑛)$

𝑇(𝑛)=𝑇(𝑛/3)+𝑇(2𝑛/3)+𝜃(𝑛)的递归树

1.3.3 主方法

主定理

考点

令 𝑎 ≥ 1和 𝑏 > 1是常数，𝑓(𝑛)是一个函数，𝑇(𝑛)是定义在非负整数上的递归式 $𝑇(𝑛) = 𝑎𝑇(𝑛/𝑏) + 𝑓(𝑛)$ ，其中将 $\frac{n}{b}$ 解释为 $\lfloor\frac{n}{b}\rfloor$ 或者 $\lceil\frac{n}{b}\rceil$ 。那么么𝑇(𝑛)有如下渐近界：
1. 若 $∃\epsilon > 0$ 有 $𝑓(𝑛)=𝑂(𝑛^{(\log_b{𝑎})−\epsilon})$ ，则 $𝑇(𝑛)=\theta (𝑛\log_b{𝑎})$;
2. 若 $𝑓(𝑛)= \theta(𝑛\log_b{𝑎})$ ，则 $𝑇(𝑛)=\theta(𝑛^{\log_b{a}}\lg n)$ ;
3. 若对某个常数 $\epsilon > 0$ 有 $𝑓(𝑛)=\Sigma(𝑛^{(\log_b{a})+\epsilon})$ ，并对某个常数𝑐 < 1和所有足够大的𝑛有 $𝑎𝑓(\frac{𝑛}{𝑏})≤ 𝑐𝑓(𝑛)$ ，则 $𝑇(𝑛)= \theta(𝑓(𝑛))$ 。

主方法

依据主定理，那么𝑇(𝑛)有如下渐近界：

$$ T(n)= \begin{cases} \theta (𝑛^{\log_b{a}}), & 𝑓(𝑛)=𝑂(𝑛^{(\log_b{𝑎})−\epsilon}) for \ some \ 𝜀 > 0\newline \theta(𝑛^{\log_b{a}}\lg n), & 𝑓(𝑛)= \theta(𝑛\log_b{𝑎}) \newline \theta(𝑓(𝑛)) , & 𝑓(𝑛)=\Omega(𝑛^{(\log_b{a})+\epsilon}) for \ some \ 𝜀 > 0 \text{ and } 𝑎𝑓(\frac{𝑛}{𝑏})≤ 𝑐𝑓(𝑛) for \ large \ 𝑛 , 𝑐 < 1 \end{cases} $$

将函数 𝑓(𝑛)与 $n^{\log_b{a}}$ 比较，两个函数较大者决定了递归式的解。

重要提示：

多项式意义(Polynomially) > > ✓ 第一种情况，𝑓(𝑛) 必须多项式意义上小于 $𝑛^{\log_𝑏{𝑎}}$ ； > > > > ✓ 第三种情况，𝑓(𝑛) 必须多项式意义上大于 $𝑛^{\log_𝑏{𝑎}}$ ；

Gap：比方说 𝑓(𝑛) = 𝑛lg𝑛, $𝑛^{\log_𝑏{𝑎}}$ = 𝑛 > > ✓ 情况1和情况2之间可能会存在gap，即 𝑓(𝑛)非多项式意义上小于 $𝑛^{\log_𝑏{𝑎}}$ ; > > > > ✓ 类似地，情况2和情况3之间也可能存在gap，即 𝑓(𝑛)非多项式意义上大于 $𝑛^{\log_𝑏{𝑎}}$ 。

对𝑏的幂证明主定理

𝑇(𝑛) = 𝑎𝑇(𝑛/𝑏) + 𝑓(𝑛),其中𝑎 ≥ 1和 𝑏 > 1是常数且，𝑓(𝑛)是一个定义在𝑏的幂上的非负函数。

将规模为𝒏的问题分解为𝒂个子问题，每个子问题规模为𝒏/𝒃，其中𝒂和𝒃都是正常数；

𝒂个子问题递归地进行求解，每个花费时间 $𝑻\left(\frac{𝒏}{𝒃}\right)$ ；

函数𝒇(𝒏)包含了问题分解和子问题解合并的代价。

𝑇(𝑛)=对𝑏的幂证明主定理

举例

例1

𝑇(𝑛)=对𝑏的幂证明主定理举例1

例2

𝑇(𝑛)=对𝑏的幂证明主定理举例2

例3

𝑇(𝑛)=对𝑏的幂证明主定理举例3

例4

𝑇(𝑛)=对𝑏的幂证明主定理举例4

1.4 递归与分治

1.4.1 理解递归概念

递归和分治关系

递归函数

用函数自身给出定义的函数称为递归函数。
递归算法

直接或间接地调用自身的算法称为递归算法。
分治法

分治法产生的子问题往往是原问题的较小模式，这就为使用递归技术提供了方便。在这种情况下，反复应用分治手段，可以使子问题与原问题类型一致而其规模却不断缩小，最终使子问题缩小到很容易直接求出其解。这自然导致递归过程的产生。

递归的例子

例1：阶乘函数

阶乘函数可递归地定义为：

$$ n!= \begin{cases} 1 & \text{if } n=0,\newline n(n-1)! & \text{if } n>0 \end{cases} $$

注：边界条件与递归方程是递归函数的两个要素 ，递归函数只有具备了这两个要素，才能在有限次计算后得出结果，否则会导致无穷递归！

考点

例2：排列问题

设计一个递归算法生成𝑛个元素{ $𝑟_1, 𝑟_2, … , 𝑟_𝑛$ }的全排列。

解：假设𝑅 = { $𝑟_1, 𝑟_2, … , 𝑟_𝑛$ }是要进行排列的𝑛个元素， $𝑅_𝑖$ = 𝑅 − { $𝑟_𝑖$ }是排除第𝑖个元素后剩余元素的集合。记集合𝑅中元素的全排列为𝑝𝑒𝑟𝑚(𝑋)， ( $𝑟_𝑖$ )𝑝𝑒𝑟𝑚( $𝑋_𝑖$ )表示在全排列𝑝𝑒𝑟𝑚(𝑋)的每一个排列前加上前缀得到的排列。

那么，𝑅的全排列可以归纳定义如下：

① 当𝑛 = 1时，𝑝𝑒𝑟𝑚 𝑅 = (𝑟)，其中𝑟是集合𝑅中唯一的元素；

② 当𝑛 > 1时，𝑝𝑒𝑟𝑚 𝑅 = {( $𝑟_1$ )𝑝𝑒𝑟𝑚( $𝑅_1$ ) , ( $𝑟_2$)𝑝𝑒𝑟𝑚( $𝑅_2$ ) , … , ( $𝑟_𝑛$ )𝑝𝑒𝑟𝑚( $𝑅_𝑛$ )} .

例3：整数划分问题

将正整数𝑛表示成一系列正整数之和：$𝑛 = 𝑛_1 + 𝑛_2 + ⋯ + 𝑛_𝑘$ ，其中 $𝑛_1 ≥ 𝑛_2 ≥ ⋯ ≥ 𝑛_𝑘 ≥ 1$ ，𝑘 ≥ 1。正整数𝑛的这种表示称为正整数𝑛的划分。求正整数𝑛的不同划分个数。

解：假设𝑞(𝑛, 𝑚)表示最大加数 $𝑛_1$ 不大于𝑚的划分个数，则有如下递归式：

$$ 𝑞(𝑛, 𝑚)= \begin{cases} 1 & \text{if } n=1,m=1, \newline 𝑞(𝑛, 𝑛) & \text{if } 𝑛<𝑚,\newline 1+𝑞(𝑛, 𝑛-1) & \text{if } 𝑛=𝑚, \newline 𝑞(𝑛, 𝑚-1)+𝑞(𝑛-𝑚, 𝑚) & \text{if } 𝑛>𝑚>1, \end{cases} $$

正整数𝑛的划分数𝒑(𝒏) = 𝒒(𝒏, 𝒏)。

如何提高递归算法效率？

如何消除递归调用，提高递归算法的计算效率？
1. 采用一个用户定义的栈来模拟系统的递归调用工作栈；
2. 用递推来实现递归函数：从边界条件开始，利用迭代式递推出最终结果；
3. 通过变换能将一些递归转化为尾递归，从而迭代求出结果。

递归与递推

例子：已知斐波那契（ Fibonacci ）数列迭代式，求Fibonacci数列的第10项。

$$ 𝑓(𝑛)= \begin{cases} 1 & \text{𝑖𝑓 } 𝑛 = 0, 1,\newline 𝑓(𝑛 − 1)+ 𝑓(𝑛 − 2) & \text{𝑖𝑓 } 𝑛 > 1 \end{cases} $$

递推求解

#define MAX 100
int f[MAX];
int fib(int n){
//输入n为项数
//输出第n个fib数
	int i;
	f[0]=0;
	f[1]=1;
	for(i=2;i<=n;i++){
		f[i]=f[i-1]+f[i-2];
	}
	return f[n];
}

递归求解

int fib(int i){
	if(i==0)
		return 0;
	if(i==1)
		return 1;
	else
		return fib(i-1)+fib(i-2);
}

尾递归

尾递归：一个函数在其内部的最后一步调用其自身。

尾递归 = 尾调用 + 递归

尾递归最后一步一定是return f(x)的形式，不能有任何其他的“运算”,例如

public int f(int n){
	if(0==n)
		return 0;
	else
		return f(n-1);
}

尾递归的例子

//尾递归:
long TailRescuvie(long n, long a)
{ 
	return(n == 1) ? a : TailRescuvie(n - 1, a * n); 
} 
long TailRescuvie(long n)
{//封装用的
	return(n == 0) ? 1 : TailRescuvie(n, 1); 
}
//尾递归的递归过程:
//TailRescuvie(5)
//TailRescuvie(5, 1)
//TailRescuvie(4, 5)
//TailRescuvie(3, 20)
//TailRescuvie(2, 60)
//TailRescuvie(1, 120)
//120

//线性递归:
long Rescuvie(long n)
{ 
	return (n == 1) ? 1 : n * Rescuvie(n - 1); 
}
//线性递归的递归过程:
//Rescuvie(5) 
//{5 * Rescuvie(4)}
//{5 * {4 * Rescuvie(3)}}
//{5 * {4 * {3 * Rescuvie(2)}}}
//{5 * {4 * {3 * {2 * Rescuvie(1)}}}}
//{5 * {4 * {3 * {2 * 1}}}}
//{5 * {4 * {3 * 2}}}
//{5 * {4 * 6}}
//{5 * 24}
//120

尾调用

尾调用：指一个函数里的最后一个动作是返回一个函数的调用结果的情形，即最后一步新调用的返回值直接被当做当前函数的返回结果。

function f(x){
	a(x);
	b(x);
	return g(x); //函数执行的最后调用另一个函数
}

如何判断是否属于尾调用？

关键看一个函数在调用另一个函数的时候，本身是否可以被“释放”。

//情况一
function f(x){
	int a=g(x);
	return a;
}
//情况二
function f(x){
	return 3+g(x);
}
//情况三
function f(x){
	if(x>0)
	{
		return g(x);
	}
	return r(x);
}

普通调用过程

function f(x){
	res = g(x);
	return res + 1;
}
function g(x){
	res = r(x);
	return res + 1;
}
function r(x){
	res = x + 1;
	return res + 1;
}

每个函数的调用都会在内存中形成一个调用记录（即“调用帧”），所有的调用帧会在一个调用栈中。

栈调用示例图

普通调用过程的风险

当函数的调用层数非常多时，调用栈会消耗不少内存，甚至会撑爆内存空间(栈溢出)，造成程序严重卡顿或意外崩溃

栈溢出

普通调用转化为尾调用

上述的普通调用过程可以转化为尾调用

function f(){
	m = 1;
	n = 2;
	return g(m+n);
}
f();
//等同于
function f(){
	return g(3);
}
f();
//等同于
g(3);

如果所有函数都是尾调用，那么完全可以做到每次执行时，调用帧为一，这将大大节省内存。

1.4.2 分治法适用条件(重点)

分治法适用条件

分治法所能解决的问题一般具有以下几个特征：

特征一

该问题规模缩小到一定的程度就可以容易地解决;

这条特征是应用分治法的前提，它也是大多数问题可以满足的，此特征反映了递归思想的应用

特征二

该问题可以分解为若干个规模小的相同问题，即具有最优子结构性质;

因为问题的计算复杂性一般是随着问题规模的增加而增加，因此大部分问题满足这个特征。

特征三

利用该问题分解出的子问题的解可以合并为该问题的解；

能否利用分治法完全取决于问题是否具有这条特征，如果具备了前两条特征，而不具备第三条特征，则可以考虑 贪心算法 或 动态规划 。

特征四

该问题所分解的各个子问题是相互独立的，即子问题之间不包含公共的子问题;

这条特征涉及到分治法的效率，如果各子问题是不独立的，则分治法要做许多不必要的工作，重复地解公共的子问题，此时虽然也可用分治法，但一般用 动态规划 较好。

分治法复杂性分析

基本步骤

divide-and-conquer(𝑃)
{
	if ( 𝑃 ≤ 𝑛0) adhoc(𝑃); //解决小规模的问题
	divide 𝑃 into smaller subinstances 𝑃1, 𝑃2, … , 𝑃𝑘；//分解问题
	for (𝑖 = 1, 𝑖 <= 𝑘, 𝑖 + +)
		𝑦𝑖=divide-and-conquer(𝑃𝑖); //递归的解各子问题
	return merge(𝑦1, ... ,𝑦𝑘); //将各子问题的解合并为原问题的解
}

时间复杂度

$$ T(n)= \begin{cases} O(1) &\text{if } n=1 \newline kT\left(\frac{n}{m}\right)+f(n) &\text{if } n>1 \end{cases} $$

可算出 $T(n)=n^{\log_m{k}} + \sum\limits_{j=0}^{\log_m{n-1}} k^j f\left(\frac{n}{m!}\right)$

1.4.3 经典例子

大整数的乘法

考点

原始竖式计算

问题描述：𝑿和𝒀是两个𝑛位的十进制整数，分别表示为𝑿 = $x_{n−1}x_{n−2} \cdots x_0$ , 𝒀 = $y_{n−1}y_{n−2} \cdots y_0$ ，其中 $0 ≤ 𝑥_𝑖$ , $𝑦_𝑗 ≤ 9 (𝑖,𝑗 = 0, 1, … 𝑛 − 1)$ ，设计一个算法求𝑿 × 𝒀，并分析其计算复杂度。

说明：算法中“基本操作”约定为两个个位整数相乘 $𝑥_𝑖 × 𝑦_𝑗$ ，以及两个整数相加。

原始的竖式计算复杂度 $T(n)=O(n^2)$

分治法

问题描述：对于两个𝑛位的整数𝑿和𝒀，计算(𝑿 × 𝒀)时的时间复杂度=？
分治法：令𝑿 = 𝑎𝑏, 𝒀 = 𝑐𝑑, 𝑚 = 𝑛/2，其中𝑎, 𝑏, 𝑐和𝑑是𝑛/2位长的整数.则𝑿𝒀 = $(10^𝑚𝑎 + 𝑏)(10^𝑚𝑐 + 𝑑) = 10^{2𝑚}𝑎𝑐 + 10^𝑚 (𝑏𝑐 + 𝑎𝑑) + 𝑏𝑑$

Multiply(X; Y; n):
if n = 1
	return X×Y
else
	m = ┏n/2┓
	a = ┗X/10m┛; b=X mod 10^m
	c = ┗Y/10m┛; d=Y mod 10^m
	e = Multiply(a; c; m)
	f = Multiply(b; d; m)
	g = Multiply(b; c; m)
	h = Multiply(a; d; m)
	return 10^2m e + 10^m (g + h) + f

时间复杂度分析：

$T(1)=1$

$T(n)=4T(\lceil n/2 \rceil)+O(n)$

利用主方法可得：

$T(n)=O(n^2)$
分治法：考虑到𝑏𝑐 + 𝑎𝑑 = 𝑎𝑐 + 𝑏𝑑 − (𝑎 − 𝑏)(𝑐 − 𝑑)，因此有

FastMultiply(X; Y; n):
if n = 1
	return X×Y
else
	m = ┏n/2┓
	a = ┗X/10m┛; b=X mod 10^m
	c = ┗Y/10m┛; d=Y mod 10^m
	e = Multiply(a; c; m)
	f = Multiply(b; d; m)
	g = Multiply(a-b; c-d; m)
	return 10^2m e + 10^m (e + f - g) + f

时间复杂度分析：

$T(1)=1$

$T(n)=3T(\lceil n/2 \rceil)+O(n)$

利用主方法可得：

$T(n)=O(n^{1.59})$

更快的算法

如果将大整数分成更多段，用更复杂的方式把它们组合起来，将有可能得到更优的算法。

最终的，这个思想导致了 快速傅利叶变换(Fast Fourier Transform) 的产生。该方法也可以看作是一个复杂的分治算法。

矩阵相乘

考点

标准方法

问题描述假设A和B是两个𝑛阶矩阵，计算𝑪 = 𝑨 × 𝑩的时间复杂度。

$$ A=\left[ \begin{matrix} a_{11} & \cdots & a_{1n} \newline \vdots & \ddots & \vdots \newline a_{n1} & \cdots & a_{nn} \end{matrix} \right] , B=\left[ \begin{matrix} b_{11} & \cdots & b_{1n} \newline \vdots & \ddots & \vdots \newline b_{n1} & \cdots & b_{nn} \end{matrix} \right] $$

标准方法: $c_{ij}=\sum\limits_{k=1}^n a_{ik}b_{kj}$

MATRIX-MULTIPLY(A, B)
for i ← 1 to n
	for j ← 1 to n
		C[i, j] ← 0
		for k ← 1 to n
			C[i, j]←C[i, j]+A[i, k]·B[k, j]
return C

时间复杂度: $O(n^3)$ 乘法和加法， $T(n)=O(n^3)$

分治法

问题描述：对两个𝑛 × 𝑛矩阵𝑨和𝑩，计算(𝑪 = 𝑨 × 𝑩)时的时间复杂度=？
分治算法：一个𝑛 × 𝑛矩阵可以被划分为四个𝑛/2 × 𝑛/2矩阵，

$$ A=\left[ \begin{matrix} A_{11} & A_{12} \newline A_{21} & A_{22} \end{matrix} \right] , B = \left[ \begin{matrix} B_{11} & B_{12} \newline B_{21} & B_{22} \end{matrix} \right] , C = \left[ \begin{matrix} C_{11} & C_{12} \newline C_{21} & C_{22} \end{matrix} \right] $$

则有

$$C_{11} = A_{11} B_{11} + A_{12} B_{21}, C_{12} = A_{11} B_{12} + A_{12} B_{22}$$

$$C_{21} = A_{21} B_{11} + A_{22} B_{21}, C_{22} = A_{21} B_{12} + A_{22} B_{22}$$

时间复杂度分析：总共划分为8个矩阵乘法子问题和4次矩阵加法:

$$𝑇(1) = 1, 𝑇(𝑛) = 8𝑇(𝑛/2) + 𝑛^2$$

利用主方法可得： $𝑻(𝒏) = 𝑶(𝒏^𝟑)$

斯特拉森矩阵乘法(主思想和分治法一样)：

Define P1 = (A11+A22)(B11+B22)
		P2 = (A11+A22)B11
		P3 = A11 (B11−B22)
		P4 = A22 (−B11+B22)
		P5 = (A11+A12)B22
		P6 = (−A11+A21)(B11+B12)
		P7 = (A12− A22)(B21+B22)
Then C11=P1+P4−P5+P7, C12=P3+P5
	 C21=P2+P4, C22=P1+P3−P2+P6

时间复杂度分析: 划分为7个矩阵乘法子问题和18次矩阵加法 $𝑇(1)=1, 𝑇(𝑛) =7𝑇(𝑛/2)+𝑐𝑛^2$

利用主方法可得：

$T(n)=O(n^{\log_2{7}})=O(n^{2.81})$

更好的算法

目前最好的计算时间上界是 $𝑂(𝑛^{𝟐.𝟑𝟕𝟔})$

多数问题（Majority Problem）

传统算法

问题描述：给定一个拥有𝑛个元素的数组𝑨，只利用'='来寻找𝐴中的多数元素（即，出现次数大于𝑛/2次的元素）。

例如：给定(2, 3, 2, 2, 3, 4, 2)，那么2就是多数元素，因为出现次数4>7/2。
传统算法：

Majority(A[1, n])
for(i = 1 to n)
	M = 1
	for(j = 1 to n)
		if (i != j and A[i]==A[j]) M++
	end
	if (M>n/2) return “A[i] is the majortiy”
end
return “No majortity”

计数次数： $𝑶(𝒏^𝟐)$

分治算法

分治算法

Majority(A[1, n])
if n=1, then
	return A[1]
else
	m1=Majority(A[1, n/2])
	m2=Majority(A[n/2+1, n])
test if m1 or m2 is the majority for A[1, n]
return majority or no majority.
for(i=1 to n) ++frequency[ A[i] ]
M = Max(frequency[ A[i] ] )
if (M > n/2) 
check( M = = frequency[ A[j] ] ) 
return “A[j] is the majority”

时间复杂度分析：

$$T(n)=2T(n/2)+O(n)=O(n \log{n})$$

循环赛日程表

问题描述：设有 $𝑛 = 2^𝑘$ 个运动员要进行网球循环赛，设计一个满足以下要求的比赛日程表：
- (1) 每个选手必须与其他𝑛 − 1个选手各赛一次；
- (2) 每个选手一天只能参赛一次；
- (3) 循环赛在𝑛 − 1天内结束。

请按此要求将比赛日程表设计成有𝑛行和𝑛 − 1列的表格。在表中的第𝑖行，第𝑗列处填入第𝑖个选手在第𝑗天所遇到的选手。其中1 ≤ 𝑖 ≤ 𝑛，1 ≤ 𝑗 ≤ 𝑛 − 1。

分治算法：

按分治策略，将所有的选手分为两半，𝑛个选手的比赛日程表就可以通过为𝑛/2个选手设计的比赛日程表来决定。递归地对选手进行分割，直到只剩下2个选手时，比赛日程表的制定就变得很简单。这时只要让这2个选手进行比赛就可以了。
思路分析：

思路分析

1.5 概率分析与随机算法

1.5.1 雇佣问题

研究背景

时间复杂度分析：最坏运行时间、最佳运行时间、平均运行时间

INSERTION-SORT(A) 										cost times
1 for( j = 2; j <=length[A]; j++) 	 				 	c1   n
2 { key = A[j] 						  			 	   c2   n-1
3 	// Insert A[j] into the sorted sequence A[1 .. j-1]  0   n-1
4 	i = j-1 											c4   n-1
5 	while( i > 0 && A[i] > key) 						c5
6	{ 	A[i+1] = A[i] 								        c6
7 		i = i-1 										c7
8 	}
9 	A[i+1] = key 										c8   n-1
10 }

时间复杂度： $T(n)=c_1n+c_2(n-1)+c_4(n-1)+c_5 \sum\limits_{j=2}^{n}t_j +c_6 \sum\limits_{j=2}^{n}t_j +c_7 \sum\limits_{j=2}^{n}t_j +c_8(n+1)$

雇佣问题

考点

问题描述

拟雇佣猎头公司帮忙物色办公室助理候选人，并制定了如下招聘策略：
- ① 由猎头公司推荐𝑛个候选人，至少从中雇佣1个；
- ② 是每天只面试一个候选人；
- ③ 面试结束当天必须确定是否雇佣该候选人。如果决定雇佣，则必须解雇当前助理；
- ④ 面试一个候选人需要花费1000元（猎头公司推荐费用）；
- ⑤ 雇佣一个候选人需要花费10000元（猎头公司推荐费用+解雇当前助理费用）。

目标：请问这种招聘策略至少需要花费多少元？

解决思路：将雇佣问题转为算法复杂度分析问题。

对候选人从1到𝑛进行编号，引入第0号虚拟候选人（比所有候选者都来得差，因此总会导致第1个候选者被雇佣），每面试一个人耗费为 $𝑐_𝑖$ ，每雇佣一个人耗费为 $𝑐_ℎ$ ，则

HIRE-ASSISTANT(n) 												cost times
best ← 0 // candidate 0 is a least-qualified dummy candidate
for i ← 1 to n
	do interview candidate i 									 ci    n
		if candidate i is better than candidate best
			then best ← i
				hire candidate i 								 ch    m

总代价：共有面试了𝑛个候选人，重复雇佣了𝑚次，总代价为 $𝑻(𝒏)=𝑶(𝒏𝒄_𝒊+ 𝒎𝒄_𝒉)$ 。
- ① 最好情况：只雇佣一次 $𝑻(𝒏)=𝑶(𝒏𝒄_𝒊+𝒄_𝒉)=𝑶(𝒏𝒄_𝒊)$
- ② 最差情况：重复雇佣𝑛次 $𝑻(𝒏)=𝑶(𝒏𝒄_𝒊+𝒏𝒄_𝒉)$

如何避免最坏情况发生？

考点

① 随机算法：强制应聘者以随机顺序出现,实现随机出现如下

➢ 为每个候选者分配一个秩：𝑟𝑎𝑛𝑘(𝑖)是1到n之间唯一的整数；
➢ 列表< 𝑟𝑎𝑛𝑘 1 , … , 𝑟𝑎𝑛𝑘(𝑛) >形成对候选者编号< 1, … , 𝑛 >的一个随机扰动；
➢ 这些秩构成了一个随机均匀排列，共有𝑛!种等概率的面试顺序。

RANDOMIZE-HIRE-ASSISTANT(n) 										cost times
Randomly permute the list of candidates
best ← 0 // candidate 0 is a least-qualified dummy candidate
for i ← 1 to n
	do interview candidate i 										 ci    n
		if candidate i is better than candidate best
		then best ← i
			hire candidate i 										 ch    m

猎头公司预先提供𝒏个候选人列表；每天随机选取一人进行面试。

如何随机扰乱数组？

考点

问题：给定一个数组𝐴 =< 1,2, … , 𝑛 >，如何产生一个均匀随机扰乱？
- ① 为每个元素𝐴[𝑖]分配一个随机数𝑃[𝑖]作为优先权；
- ② 然后依据这些优先权对数组A进行排序。

基于排序的方法：

PERMUTE-BY-SORTING(A)
n = length[A]
for(i=1; i<=n; i++)
	P[i] = RANDOM(1, n^3)
sort A, using P as sort keys
return A

特点：
- ➢ 随机数范围一般都会比较大
- ➢ 计算速度慢 (随机数发生器 + 排序）
- ➢ 比较耗费数组空间

就地扰乱方法

就地扰乱方法
- ① 从第1个元素到最后一个元素逐一扰乱；
- ② 每次迭代从𝐴[𝑖, … . , 𝑛]中随机选择一个元素𝐴[𝑖]作为第𝑖个元素𝐴[𝑖]的值；
- ③ 第𝑖次迭代后不再改变𝐴[𝑖]值。

RANDOMIZE-IN-PLACE(A, n)
for(i=1; i<=n; i++)
	swap(A[i], A[RANDOM(i, n)])

优势：
- ➢ 可在线性时间范围内完成𝑂(𝑛)；
- ➢ 随机数范围小；
- ➢ 不需要辅助空间。
定理

就地扰乱算法可以产生一个均匀随机扰乱。

1.5.2 指示器随机变量

指示器随机变量

定义：指示器随机变量是将每个结果映射成0或1的随机变量，又称为伯努利变量。

$$ I \lbrace A \rbrace = \begin{cases} 1 &\text{if A occur} \newline 0 &\text{if A does not occur} \end{cases} $$

引理5.1：给定一个样本空间𝑆和𝑆中的一个事件𝐴，设 $𝑋_𝐴 = 𝐼\lbrace 𝐴\rbrace$ ，那么 $𝐸[𝑋_𝐴] = Pr \lbrace 𝐴 \rbrace$ 。

证明：由指示器随机变量定义，以及期望值的定义，有 $E[𝑋_𝐴] = E[𝐼 \lbrace 𝐴 \rbrace ]= 1 ∙ Pr \lbrace 𝐴 \rbrace + 0 ∙ Pr \lbrace \overline{𝐴} \rbrace = Pr \lbrace 𝐴 \rbrace$

其中 $\overline{𝐴}$ 表示𝑆 − 𝐴，即A的补。

例1：确定抛一次硬币正面向上的期望？

样本空间是{𝐻, 𝑇}，其中 $Pr \lbrace 𝐻 \rbrace = Pr \lbrace 𝑇 \rbrace = \frac{1}{2}$ 。

定义一个指示器随机变量为 $𝑋_𝐻 = 𝐼 \lbrace 𝐻 \rbrace$ 对应于硬币正面朝上的事件𝐻， $𝑋_𝐻$ 记录了抛硬币时正面朝上的次数，则有

$$ 𝑋_𝐻 = 𝐼 \lbrace 𝐻 \rbrace= \begin{cases} 1 &\text{𝑖𝑓 𝐻 𝑜𝑐𝑐𝑢𝑟𝑠} \newline 0 &\text{𝑖𝑓 𝐻 𝑑𝑜𝑒𝑠 𝑛𝑜𝑡 𝑜𝑐𝑐𝑢𝑟𝑠} \end{cases} $$

根据定理 $𝐸[𝑋_𝐻] = Pr \lbrace 𝐻 \rbrace = \frac{1}{2}$ 。

例2：确定抛𝑛次硬币正面向上的期望？

设指示器随机变量 $𝑋_𝑖$ 对应第𝑖次抛硬币时正面朝上的事件𝐻，即

$$𝑋_𝑖 = 𝐼 \lbrace 第𝑖次抛硬币出现事件𝐻 \rbrace$$ 。

设随机变量𝑋表示𝑛次抛硬币中出现正面的总次数，则有:

$$𝑋 = \sum\limits_{𝑖=1}^𝑛 𝑋_𝑖$$

对𝑋求期望，得到：

$$E[X]=E[\sum\limits_{i=1}^n X_i] = \sum\limits_{i=1}^𝑛 E[X_i] = \sum\limits_{i}^n \frac{1}{2} = \frac{n}{2}$$

传统概率分析方法

假设候选人以随机顺序出现，随机变量𝑋表示雇佣新助手的人数，则有

$$𝐸[𝑋]= \sum\limits_𝑖^𝑛 𝑥_𝑖 Pr \lbrace 𝑋 = 𝑥_𝑖 \rbrace$$

指示器随机变量方法

假设候选人以随机顺序出现，随机变量𝑋表示我们雇佣新助手的人数，定义指示器随机变量 $𝑋_1,𝑋_2,…,𝑋_𝑛$ 对应于第𝑖个候选者被雇佣这一事件，即

$$𝑋_𝑖 = 𝐼 \lbrace 第𝑖个候选者被雇佣 \rbrace$$

则雇佣新助手的人数为：

$$𝑋 = 𝑋_1 + 𝑋_2 + … + 𝑋_𝑛$$

根据定理有：

$$𝐸[𝑋] = 𝐸 \left[\sum\limits_𝑖^𝑛 𝑋_𝑖 \right]= \sum\limits_𝑖^𝑛 𝐸[𝑋_𝑖] = \sum\limits_𝑖^𝑛 Pr \lbrace 第𝑖个候选者被雇佣 \rbrace$$

如何计算第𝒊个候选者被雇佣概率？

HIRE-ASSISTANT(n) 														cost times
best ← 0 // candidate 0 is a least-qualified dummy candidate
for i ← 1 to n
	do interview candidate i 											 ci    n
		if candidate i is better than candidate best
			then best ← i
				hire candidate i 										 ch    m

如果第𝑖个候选者被雇佣，则意味着第𝑖个候选者比前面𝑖 − 1个候选者都优秀；假设候选者面试顺序随机，则每一个候选者成为最佳人选的概率相等；因此， $𝐸[𝑋_𝑖] = Pr \lbrace 第𝑖个候选者被雇佣 \rbrace = \frac{1}{i}$

所以有

$$𝐸[𝑋] = 𝐸 \left[\sum\limits_𝑖^𝑛 𝑋_𝑖 \right]= \sum\limits_𝑖^𝑛 𝐸[𝑋_𝑖] = \sum\limits_𝑖^𝑛 Pr \lbrace 第𝑖个候选者被雇佣 \rbrace = \sum\limits_i^n \frac{1}{i}=\ln{n}+O(1)$$

最终期望雇佣成本是 $𝑶(𝒄_𝒉𝐥𝐧𝒏)$ 远好于最坏情况雇佣成本 $𝑶(𝒏𝒄_𝒉)$ 。

生日悖论问题

问题描述:若一个屋子里有至少2人生日相同的概率>50%，那么房间里面最少有多少人？

指示器随机变量法

设屋里共有𝑘人， $𝑏_𝑖$ 表示第𝑖人的生日( $1 ≤ 𝑖 ≤ 𝑘, 1 ≤ 𝑏_𝑖 ≤ 𝑛$ )且生日均匀分布在一年的𝑛天中，则生日落在𝑟天的概率是： $Pr \lbrace 𝑏_𝑖 = 𝑟 \rbrace = \frac{1}{𝑛}$ 。两个人𝑖和𝑗的生日都落在同一天𝑟上的概率是：

$$Pr \lbrace 𝑏_𝑖 = 𝑟且𝑏_𝑗 = 𝑟 \rbrace = Pr \lbrace 𝑏_𝑖 = 𝑟 \rbrace Pr \lbrace 𝑏_𝑗 = 𝑟 \rbrace = \frac{1}{𝑛^2}$$

两人生日落在同一天的概率是：

$$Pr \lbrace 𝑏_𝑖 = 𝑏_𝑗 \rbrace= \sum\limits_𝑟^𝑛 Pr \lbrace 𝑏_𝑖 = 𝑟且𝑏_𝑗 = 𝑟 \rbrace = \sum\limits_𝑟^𝑛 \frac{1}{n^2}= \frac{1}{𝑛}$$

对屋子里𝑘个人中的每一对(𝑖,𝑗)，其中1 ≤ 𝑖 < 𝑗 ≤ 𝑘，定义指示器随机变量 $𝑋_{𝑖𝑗}$ 如下：

$$ 𝑋_{𝑖𝑗} = 𝐼 \lbrace 𝑖和𝑗生日相同 \rbrace = \begin{cases} 1 &\text{if 𝑖和𝑗生日相同} \newline 0 &\text{others} \end{cases} $$

根据引理5.1，有：

$$𝐸[𝑋_{𝑖𝑗}] = Pr \lbrace 𝑖和𝑗生日相同 \rbrace = \frac{1}{n}$$

设𝑋表示生日相同的两人对之和的随机变量，有

$$𝑋 = \sum\limits_{𝑖=1}^𝑘 \sum\limits_{𝑗=𝑖+1}^𝑘 𝑋_{𝑖𝑗}$$

两边取期望，可以得到

$$E[X]=E \left[ \sum\limits_{i=1}^k \sum\limits_{j=i+1}^k X_{𝑖𝑗} \right]=\sum\limits_{i=1}^k \sum\limits_{j=i+1}^𝑘 E[X_{ij}] = C_2^k \frac{1}{𝑛} = \frac{k(k − 1)}{2n}$$

当 $𝑘(𝑘 − 1) ≥ 2𝑛$ 时，生日相同的两人对的期望至少是1。
对于𝑛 = 365，若𝑘 = 28人同处一屋，则可以期望至少有2个人生日相同。

传统方法

设假设 $𝐵_𝑘$ 表示𝑘人生日各不同的事件， $𝑃𝑟\lbrace 𝐵_𝑘 \rbrace$ 表示该事件发生的概率，则有

$$Pr \lbrace B_k \rbrace = Pr \lbrace B_{k−1} \rbrace Pr \lbrace A_k|B_{k−1} \rbrace$$

其中， $Pr \lbrace A_k|B_{k−1} \rbrace$ 表示第𝑘个人和前面𝑘−1个人生日互不相同的概率，且有

$$Pr \lbrace A_k|B_{k−1} \rbrace= \frac{n − k + 1}{n}$$

取 $Pr \lbrace B_1 \rbrace = Pr \lbrace A_1 \rbrace = 1$ 作为初始条件，有：

$$Pr \lbrace B_k \rbrace = Pr \lbrace B_{k−1} \rbrace Pr \lbrace A_k B_{k−1}\rbrace=⋯=$$

$$= Pr \lbrace B_1 \rbrace Pr \lbrace A_2|B_1 \rbrace...Pr \lbrace B_{k−2} \rbrace Pr \lbrace A_{k−1}|B_{k−2} \rbrace Pr \lbrace A_k|B_{k−1} \rbrace$$

$$= 1⋅ \left(1−\frac{1}{𝑛}\right)⋅ \left(1−\frac{2}{𝑛}\right)... \left(1−\frac{k-1}{𝑛}\right)$$

由不等式 $1 + 𝑥 ≤ 𝑒^𝑥$ ，得出

$$Pr \lbrace 𝐵_𝑘 \rbrace ≤ 𝑒^{- \frac{1}{n}} 𝑒^{- \frac{2}{n}} ... 𝑒^{- \frac{k-1}{n}} ≤ \frac{1}{2}$$

当 $𝑘(𝑘 − 1) ≥ 2𝑛 \ln{2}$ ，即 $k ≥ \frac{1+ \sqrt{1+ (8 \ln{2})n}{2}$ 时，𝑘个人生日互不相同的概率最多是 $\frac{1}{2}$ 。
当𝑛 = 365时，必有𝑘 ≥ 23。因此，如果由23个人同处一个屋子里，至少2人生日相同的概率大于50%.

礼券收集者问题

一个人如果想要收集齐𝑏种不同礼券中的每一种，大约需要 $𝑏ln𝑏$ 张随机得到的礼券才能成功。

1.5.3 在线雇佣问题

考点

情景描述

假设现在不希望面试所有的应聘者来找到最好的一个，也不希望因为不断有更好的申请者出现而不停地雇用新人解雇旧人。愿意雇用接近最好的应聘者，只雇用一次。但是，必须遵守猎头公司的一个规定：在每次面试之后，必须给出面试结果，要么雇用候选人，要么拒绝。

目标：最小化面试次数和最大化雇用应聘者的质量取得平衡

解决思路

考点

① 面试一个应聘者之后，给他分配一个分数。令𝑠𝑐𝑜𝑟𝑒(𝑖)表示给第𝑖个应聘者的分数，且假设所有应聘者得分都不相同；
② 面试前面𝑘个（𝑘 < 𝑛）应聘者然后拒绝他们，再雇佣其后比前面的应聘者更高分数的第一个应聘者。

ON-LINE-MAXIMUM (k, n)
	bestscore ← -∞
	for i ← 1 to k
		do if score(i) > bestscore
			then bestscore ← score(i)
	for i ← k+1 to n
		do if score(i) > bestscore
			then return i
return n

概率分析

问题：该如何选择𝑘值才能以最大概率雇佣到最好的应聘者？
结论：如果用 $𝑘 = \frac{n}{e}$ 来实现策略，那么将以至少 $\frac{1}{𝑒}$ 的概率成功雇佣到最好的应聘者。

第二章高级数据结构

2.1 排序算法

2.1.1 堆排序算法

排序问题

问题描述

输入：给定𝑛个数的序列 $< 𝑎_1, 𝑎_2,…,𝑎_𝑛 >$

输出：输入序列的一个重排 $< 𝑎_1′,𝑎_2′,…,𝑎_𝑛′ >$ ，使得 $𝑎_1′ ≤ 𝑎_2′ ≤ ⋯ ≤ 𝑎_𝑛′$
为什么要研究排序问题？
- ① 应用广泛，是许多算法的关键步骤；
- ② 已经有很多成熟算法，冒泡排序、插入排序、归并排序、快速排序……
- ③ 可以证明其非平凡下界是渐近最优的；
- ④ 在实现过程中经常伴随着许多工程问题出现。
排序的稳定性
- ① 在待排序的文件中，若存在多个关键字相同的记录，经过排序后这些具有相同关键字的记录之间的相对次序保持不变，该排序方法是 稳定的 ；
- ② 若具有相同关键字的记录之间的相对次序发生变化，则称这种排序方法是 不稳定的 。
Note:

排序算法的稳定性是针对所有输入实例而言的。即在所有可能的输入实例中，只要有一个实例使得算法不满足稳定性要求，则该排序算法就是不稳定的。

堆数据结构

树的概念

树的相关概念
- ① 结点的深度 --- 从上到下，根为第一层；
- ② 结点的高度 --- 从下到上
- ③ 树的高度 --- 树中所有节点深度值的最大值
- ④ 结点的度 --- 结点拥有的子树数
- ⑤ 树的度 --- 各结点的度的最大值

树的演示图

二叉树的相关概念
- 二叉树:每个结点至多有两颗子树
- 满二叉树：每层的结点数都是最大结点数的二叉树
- 完全二叉树：所有结点必须和满二叉树中结点在位置上一一对应

堆的概念

考点

堆数据结构是一个数组，可以被看成一棵近似的完全二叉树。树中每个结点与数组中存放该结点值的那个元素对应。

堆和树

堆的性质和种类

考点

堆的性质
- ① length[A]: 是数组中的元素个数；
- ② heap-size[A]: 是存放在A中的堆的元素个数；
- ③ heap-size[A]≤length[A]
作为数组对象的堆，给某个节点的小标则：
- ① 父节点PARENT(i) = floor(i/2)
- ② 左儿子为LEFT(i) = 2*i;
- ③ 右儿子为RIGHT(i) = 2*i + 1;
堆排序算法使用 大根堆 ，堆中最大元素位于树根。

graph TB
A((堆)) --- B(大根堆)
A --- C(小根堆)
B --- D[除根结点之外的所有结点都不大于其父结点]
C --- E[除根结点之外的所有结点都不小于其父结点]

视为完全二叉树的堆：
- ① 结点在堆中的高度：从本结点到叶子的最长简单下降路径上边的数目；
- ② 定义堆的高度为树根的高度；
- ③ 具有𝑛个元素的堆其高度为𝜃(lg𝑛)。

大根堆的基本操作

大根堆数据结构的基本操作
- ① MAX-HEAPIFY：保持最大堆性质，运行时间𝑂(lg𝑛);
- ② BUILD-MAX-HEAP：从无序的输入数组构造出最大堆，运行时间𝑂(𝑛) ；
- ③ HEAPSORT：对一个无序数组进行原地排序，运行时间𝑂(𝑛lg𝑛)；④ MAX-HEAP-INSERT, HEAP-EXTRACT-MAX, HEAP-INCREASE-KEY和HEAP-MAXIMUM可以让堆结构作为优先队列使用，运算时间为𝑂(lg𝑛)。

堆结构的基本操作时间至多与树的高度正相关。

保持最大堆(MAX-HEAPIFY)

考点

问题描述:MAX-HEAPIFY函数的输入为一个数组𝐴和下标𝑖。假定以LEFT(i)和RIGHT(i)为根的两棵二叉树都是最大堆，MAX-HEAPIFY让A[i]在最大堆中“下降”，使得以i为根的子树成为最大堆。
基本思想：从上到下不断调整
- ① 找出𝐴[𝑖], 𝐴[𝐿𝐸𝐹𝑇(𝑖)]和𝐴[𝑅𝐼𝐺𝐻𝑇(𝑖)]中最大者，将其下标存在𝑙𝑎𝑟𝑔𝑒𝑠𝑡；
- ② 交换𝐴[𝑖]和𝐴[𝑙𝑎𝑟𝑔𝑒𝑠𝑡]使得结点𝑖和其子女满足最大堆性质；
- ③ 下标为𝑙𝑎𝑟𝑔𝑒𝑠𝑡的结点在交换后的值是𝐴[𝑖]，以该结点为根的子树有可能违反最大堆性质，对该子树递归调用 MAX-HEAPIFY。

MAX-HEAPIFY(A, i)
1 l ← LEFT(i);
2 r ← RIGHT(i);
3 if l ≤ heap-size[A] and A[l] > A[i]
4 	then largest ← l
5 	else largest ← i
6 if r ≤ heap-size[A] and A[r] > A[largest]
7 	then largest ← r
8 if largest ≠ i
9 	then exchange A[i] ↔ A[largest]
10 		MAX-HEAPIFY(A, largest)

示例

时间复杂度分析

当MAX-HEAPIFY作用在一棵以结点𝑖为根的、大小为𝑛的子树上时，对以𝑖的某个子节点为根的子树大小最多为2𝑛/3（此时，最底层恰好半满）(因为堆所建的树是一个近似完全二叉树的，所以左侧子树节点数一定不少于右侧，此时不难有左侧子树节点数最多比右侧多一满层，此时由于树的性质，最下一层也就是叶子结点如果是满的，则其大小为前几层除去根的节点之和，则相当于左侧子树节点数最多为右侧子树大小两倍，所以为2𝑛/3)。

运行时间递归式：

$$T(n) \leq T\left(\frac{2n}{3}\right)+ \theta(1)$$

根据主定理，该递归式的解为𝑇(𝑛) = 𝑂(𝑙𝑔𝑛)。

MAX-HEAPIFY作用于一个高度为ℎ的结点所需的运行时间为𝑂(ℎ)，这个是由于高度h和n之间关系决定的。

建堆操作(BUILD-MAX-HEAP)

考点

问题描述

输入是一个无序数组A，BUILD-MAX-HEAP把数组A变成一个最大堆。
基本思想：

从最后一个内结点开始，由后往前对数组中每个内结点都调用一次MAX-HEAPIFY，使得以内节点为根的子树满足大根堆性质。不断调整，直到根节点为止。

BUILD-MAX-HEAP (A)
1 heap-size[A] ← length[A];
2 for i ← FLOOR( length[A]/2 ) downto 1
3 	do MAX-HEAPIFY(A, i)

时间复杂度分析

在树中不同高度的结点处运行MAX-HEAPIFY的时间不同，其作用在高度为ℎ的结点上的运行时间为𝑂(ℎ)，故BUILD-MAX-HEAP时间代价为

$$T(n) \leq \sum\limits_{h=0}^{|\lg{n}|}\lceil \frac{n}{2^{h+1}} \rceil O(h)=O\left(n \sum\limits_{h=0}^{|\lg{n}|}\frac{h}{2^{h+1}}\right) \leq O\left(n \sum\limits_{h=0}^{\infty}\frac{h}{2^{h+1}}\right)=O(n)$$

即：BUILD-MAX-HEAP可以在 线性时间 内将一个无序数组建成一个最大堆。

堆排序算法(HEAPSORT)

考点

基本思想：
- ① 调用BUILD-MAX-HEAP将输入数组𝐴[1 … 𝑛]构建成一个最大堆；
- ② 互置𝐴[1]和𝐴[𝑛]位置，使得堆的最大值位于数组正确位置；
- ③ 减小堆的规模；
- ④ 重新调整堆，保持最大堆性质。

HEAPSORT( A )
1 BUILD-MAX-HEAP(A)
2 for i ← length[A] downto 2
3 	do exchange A[1] ↔ A[i]
4 		heap-size[A] ← heap-size[A] -1
5 		MAX-HEAPIFY( A, 1)

时间复杂度分析：
- ① 调用BUILD-MAX-HEAP时间为𝑂(𝑛);
- ② 每次调用MAX-HEAPIFY代价为𝑂(lg𝑛),共调用𝑛 − 1次。
- ③ 总时间复杂度：𝑶(𝒏𝐥𝐠𝒏)。

优先级队列

定义：优先级队列是一种用来维护由一组元素构成的集合S的数据结构，这一组元素中的每一个都有一个关键字Key。
基本操作
- ① INSERT(S, x)：把元素𝑥插入集合𝑆中；
- ② MAXIMUM(S)：返回𝑆中具有最大关键字的元素；
- ③ EXTRACT-MAX(S)：去掉并返回𝑆中的具有最大关键字的元素；
- ④ INCREASE-KEY(S, x, k)：将元素𝑥的关键字的值增加到𝑘，这里𝑘值不能小于𝑥的原始关键字的值。
最大优先级队列经常被用于分时计算机上的作业调度。
最小优先级队列经常被用于基于事件驱动的模拟器。

插入操作

将新元素增加到数组的最后，然后自下而上的进行堆有序化即可。

示例

删除操作

从根节点得到要删除的元素，交换根节点与最后一个叶子节点，此时根节点的左右节点均为大根堆，则只需要自上而下的进行堆的调整即可

示例

2.1.2 快速排序算法

快速排序算法

快速排序是C.R.A.Hoare于1962年提出的一种地排序算法。对于包含𝑛个数的输入数组，最坏情况运行时间为 $Ө(𝑛^2)$ ，期望运行时间为Ө(𝑛𝑙𝑔𝑛)且常数因子较小。

基本思路

采用了一种分治的策略把未排序数组分为两部分，然后分别递归调用自身进行排序：
- ① 分解：数组𝐴[𝑝 … 𝑟]被划分为两个(可能空)子数组𝐴[𝑝 … 𝑞 − 1]和𝐴[𝑞 + 1. . 𝑟]，使得𝐴[𝑝 … 𝑞 − 1]中每个元素都小于或等于𝐴[𝑞]和𝐴[𝑞 + 1. . 𝑟]中的元素。下标𝑞在这个划分过程中进行计算；
- ② 解决：递归调用快速排序，对子数组𝐴[𝑝 … 𝑞 − 1]和𝐴[𝑞 + 1. . 𝑟]排序；
- ③ 合并：不需要任何操作。

快速排序伪代码

考点

快速排序算法

QUICKSORT(A, p, r )
1 if p < r
2 then q ← PARTITION(A, p, r )
3 	QUICKSORT( A, p, q-1 )
4 	QUICKSORT( A, q+1, r )

注:为排序一个完整数组，最初调用 QUICKSORT(A, 1, length[A])。

数组划分过程PARTITION是QUICKSORT算法的关键，它对子数组𝐴[𝑝. . 𝑟]进行就地排序。

数组划分过程PARTITION

PARTITION(A, p, r )
1 x ← A[r] // x 为主元
2 i ← p - 1
3 for j ← p to r – 1
4 	do if A[j] ≤ x
5 		then i ← i + 1
6 			exchange A[i] ↔ A[j]
7 exchange A[i + 1] ↔ A[r]
8 return i + 1

i和j如何改变？

情况一

情况二

示例

快速排序算法时间复杂度

最坏划分情况

考点

最坏划分情况： $𝜽(𝒏^𝟐)$
$T(n)=\max\limits_{1≤q≤n}\lbrace T(q-1)+T(n-q)\rbrace + \theta (n) =\max\limits_{0≤k≤n−1}\lbrace T(k)+T(n-k-1)\rbrace + \theta (n)$

猜测解为 $T(n) = O(n^2)$ ，下面证明 $T(n)≤cn^2$ 成立。

假设𝑘 < 𝑛时结论成立，则 $T(k)≤ck^2，T(n-k-1)≤ c(n-k-1)^2$

当𝑘 ≥ 𝑛时，有：$T(n) ≤ \max\limits_{0≤k≤n−1}\lbrace ck^2+c(n-k-1)^2 \rbrace + \theta (n) ≤ c \max\limits_{0≤k≤n−1}\lbrace k^2+(n-k-1)^2 \rbrace + \theta (n)$

$T(n) ≤ c(n-1)^2 + \theta (n) ≤ cn^2 -c(2n-1)+ \theta (n) ≤ cn^2$

当𝑐足够大时上述不等式就成立了

最差情况

最佳划分情况

考点

最佳划分情况：𝑶(𝒏𝐥𝐠𝒏)
此时得到的子问题规模都不可能大于𝑛/2，运行事件的递归表达式为：

$$T(n) \leq 2T(\frac{n}{2})+ \theta (n)$$

根据主定理，该递归式的解为：𝑻(𝒏)=𝑶(𝒏𝐥𝐠𝒏).

如果以固定比例进行划分，即使该比例很不平衡(如1000：1)，则其运行时间仍然为𝑶(𝒏𝐥𝐠𝒏)

平均划分情况

考点

平均划分情况：𝑶(𝒏𝐥𝐠𝒏)
好和差的划分都是随机分布的。假设好和差的划分交替出现在树的各层次上，产生3个子数组0, $\frac{n-1}{2}-1$ , $\frac{n-1}{2}$ 。

平均情况

该组合的划分代价为𝜃(𝑛) + 𝜃(𝑛 − 1) = 𝜃(𝑛)。

快速排序算法的随机化

考点

策略1：显示地对输入进行排序使得快速排序算法随机化。

RANDOMIZED-QUICKSORT(A, p, r )
1 if p < r
2	 RANDOMIZE-IN-PLACE(A)
3 	 QUICKSORT( A )

策略2：采用随机取样的随机化技术。

具体地，从子数组𝐴[𝑝 … 𝑟]中随机选择一个元素作为主元，从而达到可以对输入数组的划分能够比较对称。

RANDOMIZED-PARTITION(A, p, r )
1 i ← RANDOM( p, r )
2 exchange A[r] ↔ A[i]
3 return PARTITION( A, p, r )

新排序算法调用 RANDOMIZED-PARTITION 。

RANDOMIZED-QUICKSORT(A, p, r )
1 if p < r
2 then q ← RANDOMIZED-PARTITION(A, p, r )
3 	QUICKSORT( A, p, q-1 )
4 	QUICKSORT( A, q+1, r )

期望运行时间

考点

期望运行时间为 $O(nlgn)$ ，详细推导见书P99-P101。

2.1.3 线性时间排序

排序算法的下界

考点

排序决策树模型

① 利用二叉树来表示对所有元素的比较操作；
② 每个内节点表示一次比较 $a_i ≤ a_j$ ；
③ 每个叶子结点对应一种排序结果 $<a_1',a_2',...,a_n'>$ 共有𝑛!种；
④ 从根节点到某个叶子结点对应于比较排序的一次实际执行过程;
⑤ 任何一个以元素比较为基础排序𝑛个元素的排序算法，所对应的决策树的高度至少有Ω(𝑛lg𝑛)。

示例

排序算法的下界

定理:在最坏情况下，任何比较排序算法都需要做Ω(𝑛lg𝑛)次比较。

证明：因为可能有𝑛!种可能的排序结果，故对应的决策树至少有𝑛!个叶子结点。而高度为ℎ的二叉树最多有2 ℎ个叶子结点。故 $h ≥ \log_2 (n!) ≥ 𝜃(nlgn)$ .
推论:堆排序和归并排序都是渐近最优的比较排序算法。

证明：堆排序和归并排序的运行时间上界为𝑂(𝑛lg𝑛)，这与定理中给出的最坏情况下的下界Ω(𝑛lg𝑛)是一致的。

计数排序

考点

使用条件

① 所有待排序元素均为整数，介于1到𝑘之间；
② 当𝑘 = 𝑂(𝑛)，时间复杂度为：𝑂(𝑛 + 𝑘)

基本思想

① 对每一个输入元素𝑥，统计出小于𝑥的元素的个数； = ② 根据这一信息直接把元素𝑥放到它在最终输出数组中的位置上。

执行过程示例

示例

计数排序算法是稳定的，经常被当做基数排序算法的一个子过程

基数排序

考点

适用条件

所有待排序元素均为整数，至多是𝑑位。

核心思路

利用稳定排序算法（计数排序法）由低位数排到高位数。

Radix-Sort (A, d)
1 for i =1 to d
2 	利用稳定排序算法对数组A的第i位进行排序

示例

注意事项

① 按位排序必须使用稳定排序算法，如果适用计数排序则每次迭代只需要花𝜃(𝑛 + 10)的时间； = ② 总共花费𝑂(𝑑(𝑛 + 10))的时间；
③ 如果𝑑是常数，则 Radix-Sort 为一个可以在线性时间内完成的排序算法

桶排序

考点

适用条件

当元素均匀分布在某个区间时。

基本思想

把区间[0,1)划分成𝑛个相同大小的子区间（称为桶），将𝑛个输入数分布到各个桶中去，对桶中各个元素进行排序，依次把各桶中的元素列出来即可
假定要排序𝑛个元素𝐴[1 … 𝑛]均是介于[0,1]之间的数值，桶排序步骤如下：
- ①准备𝑛个桶𝐵[1 … 𝑛]，将元素𝑥依照所在的区间放进对应的桶中 $x_n$ ；
- ②元素进桶时用链表来存储，利用插入排序法排序；
- ③依次将链表串接起来，即得到已排序的𝑛个元素。

示例

时间复杂度分析

假定分到第𝑖个桶的元素个数是 $n_i$ ，则：

① 最差情形：

$$T(n) = O(n) + \sum\limits_{1≤i≤n} n_i^2 = O(n^2)$$

② 平均情形：

$$T(n) = O(n) + \sum\limits_{1≤i≤n} O(E[n_i^2]) = O(n) + \sum\limits_{1≤i≤n} O(1)= O(n)$$

其中，$E[n_i^2]=\theta (1)$ 的证明请参考课本

2.1.4 排序算法小结

各种排序算法评价

排序算法之间的比较主要考虑以下几个方面：
- ①算法的时间复杂度
- ②算法的辅助空间
- ③排序的稳定性
- ④算法结构的复杂性
- ⑤参加排序的数据规模
- ⑥排序码的初始状态
当数据规模𝑛较小时， $n^2$ 和 $nlog_2n$ 的差别不大，则采用简单的排序方法比较合适。
- ✓ 如直接插入排序或直接选择排序等
- ✓ 由于直接插入排序法所需记录的移动较多，当对空间的要求不多时，可以采用表插入排序法减少记录的移动
当文件的初态已基本有序时，可选择简单的排序方法。
- ✓ 如直接插入排序或起泡排序等
当数据规模𝑛较大时，应选用速度快的排序算法
- ✓ 快速排序法最快，被认为是目前基于比较的排序方法中最好的方法；
- ✓ 当待排序的记录是随机分布时，快速排序的平均时间最短。但快速排序有可能出现最坏情况，则快速排序算法的时间复杂度为 $O(n^2)$ ，且递归深度为𝑛，即所需栈空间为𝑂(𝑛)

排序算法比较

2.2 顺序统计学

2.2.1 以期望线性时间做选择

问题描述

在一个由𝑛个元素组成的集合中，第𝑖个顺序统计量是该集合中第𝑖个小的元素
一个中位数是它所在集合的“中点元素”。
- ① 当𝑛为奇数时，中位数是唯一的，𝑖 = (𝑛 + 1)/2;
- ② 当𝑛为偶数时，中位数有两个，𝑖 = 𝑛/2（下中位数）和𝑖 = 𝑛/2 + 1（上中位数）。
选择问题:从一个由𝑛个不同值构成的集合中，选择其第𝑖个顺序统计量。
- ✓ 输入：一个包含𝑛个（不同的）数的集合𝐴和一个数𝑖（1 ≤ 𝑖 ≤ 𝑛）；
- ✓ 输出：元素 $x \in A$ ，它恰大于𝐴中其它𝑖 − 1个元素。

最小值和最大值

考点

最小/最大值：最坏情形进行𝑛 − 1次比较，时间复杂度为𝜃(𝑛)。

MINIMUM ( A )
1 min ← A[1];
2 for i ← 2 to length[A]
3 	do if min > A[i]
4 		then min ← A[i]
5 return min

总共比较了𝑛 − 1次，时间复杂度为𝜃(𝑛)。

同时找最小值和最大值
- ① 记录比较过程中遇到的最小值和最大值；
- ② 成对处理元素，比较当前两个元素，把较小者与最小值比较，较大者与最大值比较；

MAX-MINIMUM ( A )
1 if length[A] is odd
2 	then min ← A[1]; max ← min;
3 	else min ← MIN( A[1], A[2] ), max ← MAX( A[1], A[2] );
4 i ++;
5 while i ≤ length[A]
6 	min ← MIN( MIN(A[i], A[i+1]), min )
7 	max ← MAX( MAX(A[i], A[i+1]), max )
8 	i ← i+2;
9 end 
10 return min, max

总比较次数：
- ① 如果𝑛是奇数，总共做了 $3\lfloor n/2 \rfloor$ 次比较；
- ② 如果𝑛是偶数，总共做了 $\frac{3𝑛}{2}− 2$ 次比较。
- 时间复杂度为𝑶(𝒏)。

以期望线性时间做选择

考点

选择问题

从一个由𝑛个不同值构成的集合中，选择其第𝑖个顺序统计量。

基本思想

采用分治策略，借鉴快速排序的随机划分法，对输入数组进行递归划分，但是只处理划分的一边。

RANDOMIZED-SELECT ( A, p, r, i )
1 if p = r
2 	then return A[p]
3 q ← RANDOMIZED-PARTITION( A, p, r )
4 k ← q – p + 1
5 if i = k
6 	then return A[q];
7 else if i < k
8 	then return RANDOMIZED-SELECT ( A, p, q - 1, i )
9 else 
10 	return RANDOMIZED-SELECT( A, q+1, r, i – k )

示例

时间复杂度分析

① 幸运的例子：每次都能去除十分之一以上。

$$T(n)=T \left( \frac{9n}{10}\right)+\theta (n)=O(n)$$

② 运气不好的例子：每次都只能去除以一个元素。

$$T(n)=T(n-1)+ \theta (n)=O(n^2)$$

③ 平均情况：假设第𝑖小的元素总是掉在较大的子问题中，对任一𝑘 = 1 … 𝑛,𝐴[𝑝 … 𝑞] 恰有𝑘个元素的几率为1/𝑛。令 $X_k = I \lbrace 𝐴[𝑝 … 𝑞] 恰有𝑘个元素 \rbrace$ ，则 $E[X_k] = \frac{1}{n}$ 。

$$T(n) \leq \sum\limits_{k=1}^n X_k·(T(max(k-1,n-k))+O(n))=\left[ \leq \sum\limits_{k=1}^n X_k·T(max(k-1,n-k)) \right]+O(n)$$

$$E[T(n)] \leq E \left[ \sum\limits_{k=1}^n X_k·(T(max(k-1,n-k))+O(n)) \right] = \sum\limits_{k=1}^n E[X_k·T(max(k-1,n-k))]+O(n)=\sum\limits_{k=1}^n E[X_k]·E[T(max(k-1,n-k))]+O(n)$$

$$= \sum\limits_{k=1}^n \frac{1}{n} · E[T(max(k-1,n-k))]+O(n)$$

$$ 因为max(k-1,n-k)= \begin{cases} k-1 ,& \text{if } k > \lceil \frac{n}{2} \rceil \newline n-k ,& \text{if } k \leq \lceil \frac{n}{2} \rceil \end{cases} $$

$$\leq \frac{2}{n} \sum\limits_{k= \lfloor \frac{n}{2} \rfloor}^{n-1} E[T(k)]+O(n)$$

两边取期望，则

$$E[T(n)] \leq \frac{2}{n} \sum\limits_{k= \lfloor \frac{n}{2} \rfloor}^{n-1} ck+an \leq \frac{2c}{n} \sum\limits_{k= \lfloor \frac{n}{2} \rfloor}^{n-1} k+an$$

$$\frac{2c}{n} \left(\sum\limits_{k=1}^{n-1} k- \sum\limits_{k=1}^{\lfloor \frac{n}{2} \rfloor -1} k \right) +an = \frac{2c}{n} \left( \frac{n(n-1)}{2}- \frac{1}{2} \left( \lfloor \frac{n}{2} \rfloor -1 \right) \lfloor \frac{n}{2} \rfloor \right)+an$$

$$ \leq \frac{2c}{n} \left( \frac{n(n-1)}{2}- \frac{1}{2} \left( \frac{n}{2} -2 \right) \left( \frac{n}{2} -1 \right)\right)+an=c \left( \frac{3n}{4}+ \frac{1}{2} -\frac{2}{n} \right)+an$$

$$\leq c \left( \frac{3n}{4}+ \frac{1}{2}\right)+an=cn- \left( \frac{cn}{4}- \frac{c}{2}-an\right)$$

可以取足够大的𝑐使得 $c \left(\frac{n}{4}− \frac{1}{2}\right)$ 大于𝑎𝑛使得最后一个不等式成立。

2.2.2 最坏情况线性时间做选择

考点

基本思想

类似 RandomizedSelect 算法，通过对输入数组进行递归划分来找出所求元素，但是算法保证每次对划分是个好划分。

主要步骤

Step 1: 将𝑛个元素分成5个1组，共𝑐𝑒𝑖𝑙𝑖𝑛𝑔(𝑛/5)组。其中，最后1组有𝑛 𝑚𝑜𝑑 5个元素；
Step 2: 用插入排序对每组排序，取其中值。若最后1组有偶数个元素，取较小的中值；
Step 3: 递归地使用本算法寻找𝑐𝑒𝑖𝑙𝑖𝑛𝑔(𝑛/5)个中位数的中值𝑥;
Step 4: 用𝑥作为划分元对数组𝐴进行划分，并设𝑥是第𝑘个最小元；
Step 5: 𝑖𝑓 𝑖 = 𝑘 𝑡ℎ𝑒𝑛 𝑟𝑒𝑡𝑢𝑟𝑛 𝑥;
- 𝑒𝑙𝑠𝑒 𝑖𝑓 𝑖 < 𝑘 𝑡ℎ𝑒𝑛 寻找左区间的第i个最小元；
- 𝑒𝑙𝑠𝑒 寻找右区间的第𝑖 − 𝑘个最小元。

SELECT ( A, p, r, i ) {
1 if ( r-p ≤ 140 ) {
2 	用简单的排序算法对数组A[p..r]进行排序；
3 	return A[p+k-1];
4 }
5 n = r - p + 1;
6 for i ← 0 to floor(n/5) 
7 	将A[p + 5*i]至A[p+5*i+4]的第3小元素与A[p+i]交换位置；
8 x = Select(A, p, p + floor(n/5), floor(n/10) ); 
9 i = Partition(A, p, r, x), j = i – p + 1;
10 if (k ≤ j ) return Select( A, p, i, k );
11 else return Select( A, i + 1, r, k - j );
}

时间复杂度分析

示例

① 由上图示，可知至少有 $3\left(\lceil \frac{1}{2} \lceil \frac{n}{5} \rceil \rceil - 2\right) \geq \frac{3n}{10}-6$ 的元素较𝑥来得大。
② 同理，至少有 $\frac{3n}{10}−6$ 的元素较𝑥来得小。
③ 如果Partition过，𝑖 ≠ 𝑘, 则至多只要在 $\frac{7n}{10}+6$ 个元素的情况下递归调用 Select 。
④ 而先前找出 $\lceil \frac{n}{5}\rceil$ 小组中位数的中位数时，只在𝑛/5个元素的情况下递归调用 Select 。
⑤ 故 $T(n)=T \left(\lceil \frac{n}{5} \rceil \right) + T \left(\frac{7n}{10}+6\right)+ \theta (n),\text{for } n \geq 140$

利用替换法，令𝑇(𝑛)= 𝑂(𝑐𝑛)，则：

$$T(n) \leq c \lceil \frac{n}{5} \rceil + c \left(\frac{7n}{10}+6 \right)+ an \leq c \frac{n}{5} + c + c \frac{7n}{10}+6c+ an= \frac{9cn}{10} +1c+an=cn+ \left(- \frac{cn}{10}+7c+an \right)$$

$$\leq cn, \text{if } - \frac{cn}{10}+7c+an leq 0}$$

假设𝑛 > 140时，𝑐 ≥ 20𝑎，该式就可以成立。

2.3 平衡树

2.3.1 二叉搜索树

概念

定义：二叉搜索树，也称为二叉查找树、有序二叉树或排序二叉树，是指一棵空树或者具有下列性质的二叉树。
- ① 若任意节点的左子树不空，则左子树上所有节点的值均小于它根节点的值；
- ② 若任意节点的右子树不空，则右子树上所有节点的值均大于或等于它根节点的值；
- ③ 任意节点的左、右子树也分别为二叉查找树。
为什么使用二叉查找树这种数据结构？

回答

元素插入操作

基本步骤

① 若T是空树，则将s所指节点作为根节点插入，返回；
② 若s->data小于T的根节点的数据域之值：
- ➢ 若T的左子树为空，则把s所指节点作为T的左子树插入，返回；
- ➢ 在T的左子树中递归寻找插入点；
③ 若s->data大于等于T的根节点的数据域之值：
- ➢ 若T的右子树为空，则把s所指节点作为T的右子树插入，返回；
- ➢ 在T的右子树中递归寻找插入点。

示例

插入操作一定发生在叶子节点

二叉搜索树的构造过程即为一系列元素的插入过程！

元素删除操作

基本步骤

Case 1: 删除叶子结点

✓ 直接删除

示例

Case 2: 删除带有一个子节点的节点

✓ 将待删除节点的左/右子树赋值给待删除节点的父节点的左/右子树

示例

Case 3: 删除带有两个子节点的节点
- A. 首先需要找到待删除节点的后继节点和该后继节点的父节点；
- B. 删除节点的后继节点一定是删除节点右子树的最左侧节点，我们将采用后继节点替代待删除节点，分为两种情况：
✓ 后继节点是待删除节点的子节点（左图）

✓ 后继节点不是待删除节点的子节点（右图）

示例

✓ 后继节点是待删除节点的子节点（左图）

在后继节点为待删除节点的子节点的前提下，该后继节点有右子树和没有右子树的操作是相同的，都是将后继节点替代待删除节点，并将待删除节点的左子树赋值给后继节点的左子树；

示例

后继节点不是待删除节点的子节点（右图）

此时与上面的后继节点没有右子节点相比需要增加一个操作，需要将后继节点的右子树赋值给后继节点的父节点的左子树；

示例

时间复杂度分析

构造二叉搜索树

用一组数值建造一棵二叉搜索树的同时，也把这组数值进行了排序。其平均时间复杂度为𝑂(𝑛log𝑛)，最差时间复杂度为 $O(n^2)$ 。

✓ 例如，若该组数值已经是有序的（从小到大），则建造出来的二叉查找树的所有节点，都没有左子树。此时构造时间复杂度为 $O(n^2)$ 。
我们可以通过随机化建立二叉搜索树来尽量的避免这种情况，但是在进行了多次的操作之后，由于在删除时，我们总是选择将待删除节点的后继代替它本身，这样就会造成总是右边的节点数目减少，以至于树向左偏沉。这同时也会造成树的平衡性受到破坏，提高它的操作的时间复杂度。

搜索二叉搜索树

最坏情况下，当先后插入的关键字有序时，构成的二叉查找树蜕变为单支树，树的深度为元素个数𝑛，其平均查找长度为(𝑛 + 1)/2（和顺序查找相同）。
最好的情况是二叉查找树的形态和二分查找的判定树相同，其平均查找长度为𝑂(log𝑛)。

删除元素

从一棵二叉搜索树中删除一个元素时，已知寻找待删除元素所需平均时间为O(log n)，最差时间为𝑂(𝑛)。删除操作所需时间为𝑂(1)。故而删除某个元素所需总时间平均时间复杂度为𝑂(log 𝑛)，最差时间复杂度为𝑂(𝑛)。

二叉树时间复杂度

2.3.2 AVL树

概念

在计算机科学中，AVL树是最早被发明的自平衡二叉搜索树。AVL树得名于它的发明者G. M. Adelson-Velsky和 Evgenii Landis。它具有以下特点：
- ✓ 它是一棵空树或它的左右两个子树的高度差的绝对值不超过1;
- ✓ 左右两个子树都是一棵AVL树。

2.3.3 红黑树及扩张

2.3.4 B树/B+树/B*树

算法分析复习提纲

1 引言(ch1)

什么是算法及其特征

问题实例和问题规模

2 算法初步(ch2)

插入排序算法

算法复杂性及其度量

(1) 时间复杂性和空间复杂性；

(2) 最坏、最好和平均情形复杂性；

插入排序的最坏、最好和平均时间

归并排序算法及其时间复杂性

3 函数增长率(ch3)

渐近记号 O、Ω、θ的定义及其使用

标准复杂性函数及其大小关系

和式界的证明方法

4 递归关系式(ch4)

替换法

(1)猜测解→数学归纳法证明；

(2)变量变换法；

迭代法

(1)展开法；

(2)递归树法；

主定理

5 概率分析(ch5)

雇佣问题及其随机算法(略)

序列随机排列的两种方法及其复杂性

在线雇佣问题及其概率分析(略)

6 堆排序(ch6)

堆的概念和存储结构

堆的性质和种类

堆的操作：建堆；整堆；

堆排序算法和时间复杂性

优先队列及其维护操作

7 快速排序(ch7)

快速排序算法及其最好时间、最坏时间和平均时间

随机快速排序算法及其期望时间

8 线性时间排序(ch8)

基于比较的排序算法下界：Ω(nlogn)

计数排序适应的排序对象、算法和时间

基数排序适应的排序对象、算法和时间

桶排序适应的排序对象、算法和时间

9 中位数和顺序统计(ch9)

最大和最小值的求解方法

期望时间为线性的选择算法

最坏时间为线性的选择算法及其时间分析

10 红黑树(ch13)

红黑树的定义和节点结构

黑高概念

一棵 n 个内点的红黑树的高度至多是 2log(n+1)

左旋算法

插入算法、时间、至多使用 2 次旋转

删除算法、时间、至多使用 3 次旋转

11 数据结构的扩张(ch14)

动态顺序统计：扩展红黑树，支持①选择问题(给定 Rank 求相应的元素)，②Rank 问题(求元素 x 在集合中的 Rank)

(1)节点结构的扩展；

(2)选择问题的算法；

(3) Rank 问题的算法；

(4)维护树的成本分析；

如何扩张一个数据结构：扩张的步骤；扩张红黑树的定理(略)

区间树的扩张和查找算法(略)

12 递归与分治法(sch1)

递归设计技术

递归程序的非递归化

算法设计

(1) 最近点对； (2) 生成全排列；

(3) 大整数乘法； (4) Stranssen 矩阵乘法；

13 动态规划(ch15)

方法的基本思想和基本步骤

动态规划和分治法求解问题的区别

最优性原理及其问题满足最优性原理的证明方法

算法设计

(1) 多段图规划； (2) 矩阵链乘法；

(3) 最大子段和； (4) 最长公共子序列；

(5) 0-1 问题求解； (6) 凸多边形最优三角剖分问题；

14 贪心算法(ch16)

方法的基本思想和基本步骤

贪心算法的正确性保证：满足贪心选择性质

贪心算法与动态规划的比较

两种背包问题的最优性分析：最优子结构性质和贪心选择性质

算法设计

(1)小数背包； (2) 活动安排；

(3)找钱问题； (4) 最优装载问题；

(5)单源最短路径；

15 回溯法(sch2)

方法的基本思想和基本步骤

回溯法是一种深度遍历的搜索

术语: 三种搜索空间, 活结点, 死结点, 扩展结点, 开始结点, 终端结点

两种解空间树和相应的算法框架

算法设计

(1) n 后问题； (2) 0-1 背包；

(3) 排列生成问题； (4) TSP 问题；

(5) 符号三角形问题; (6) 图的 m 着色问题；

16 分支限界法(sch3)

方法的基本思想和基本步骤

与回溯法的区别

活结点的两种扩展方式

0-1 背包问题的搜索: FIFO 队列和优先队列

算法设计

(1)0-1 背包问题； (2)装载问题(略)；(3)单源最短路径问题；

17 随机算法(sch4)

随机算法的定义

线性同余法是产生伪随机数的最常用的方法

随机算法的分类：数值随机化算法、拉斯维加斯算法、蒙特卡罗算法、舍伍德算法

(1)利用随机投点法求解π值、计算定积分；

(2)学过的舍伍德算法包括：快排的随机化版本、选择问题的随机化版本；

(3)N-后问题的拉斯维加斯算法，及其与回溯法的结合；

(4) 主元素问题的蒙特卡罗算法；

Name		Name	Last commit message	Last commit date
Latest commit History 106 Commits
img		img
LICENSE		LICENSE
README.md		README.md
index.html		index.html

Folders and files

Latest commit

History

Repository files navigation

课前须知

关于评分

第一章 算法分析技术

1.1 算法入门

1.1.1 课程学习背景

算法定义

算法特征

问题与问题实例

输入实例与问题规模

正确算法与不正确算法

1.1.2 算法分析基础

问题求解与算法描述

问题求解过程

算法分析框架(import)

示例:插入排序

问题描述（也叫形式化描述）

算法

算法效率分析

1.1.3 算法设计策略——分治法

概述

示例：归并排序

归并排序算法(Merge sort algorithm)

关键步骤

分支法分析

分治法时间复杂度

归并排序最坏运行时间

归并排序时间复杂度求解

1.2 函数增长

1.2.1 渐进记号

渐进记号

Θ记号：渐近紧界（asymptotically tight bound）

定义

举例

关于渐进紧界

𝑂记号：渐近上界（asymptotically upper bound）

𝑂(𝒈(𝒏))定义

关于渐进上界的说明

𝑓(𝑛)=𝑂(𝑔(𝑛))说明

$𝑂(n^2)$ 函数举例

𝜴记号：渐近下界(asymptotically lower bound)

𝜴(𝒈(𝒏))定义

关于渐进下界的说明

𝑓(𝑛)=𝛺(𝑔(𝑛))说明

$𝛺(n^2)$ 函数举例

定理1.3.1

关于渐进上界和下界某些说明

等式和不等式中的渐近记号

o记号：非渐近紧确上界

ω记号：非渐近紧确下界

函数比较

1.2.2 常用函数

标准记号与常用函数

1.2.3 级数求和

级数求和

确定求和时间的界

1.3 递归式求解

1.3.1 代换法

引言

代换法

猜测法

示例

如何做一个好的猜测？

关于部分陷阱

改变变量法

1.3.2 迭代法

展开法

举例

关于迭代法的某些处理

递归树法

举例

1.3.3 主方法

主定理

主方法

对𝑏的幂证明主定理

举例

1.4 递归与分治

第一章算法分析技术

第二章高级数据结构