# 第二讲 算法分析基础

## 为什么要分析算法

之所以分析算法，因为算法普遍具有这样的性质：
- 一个问题有多种解法，从诸多解法中选出“最”好那个，很不容易
- 计算机运行时间和占用空间都是宝贵、有限的资源。找到性能最佳，耗用最少时间、空间资源的算法十分有意义。

算法设计是决定着算法、程序、软件、系统性能优劣的重要因素。复杂度是度量算法性能优劣的量化指标。算法分析是利用数学工具，讨论算法的复杂度，进而比较算法的相对优劣。

## 算法分析体系
分析，即预估算法需要的资源：时间、空间。

### 分析算法的基本假设

1. 单一通用处理器（即使实际使用多核PC）
2. 随机访问机器模型Random-access machine model (von-Neumann architecture，串行机)

以上两点保证机器指令顺序执行、不并发。

3. 使用基本指令计算：逻辑运算control/relational、算术运算arithmetric、赋值data movement

4. 不考虑缓存cache和虚拟内存virtural memory。

通俗说，我们的算法运行在串行计算机上，没有并行，没有分布式，没有硬盘。以上假设，将我们要探讨的算法与其他算法区分开来。

- 并行算法
- 数据库算法，考虑对辅存/硬盘的读入读出
- 网络算法，考虑网络路由对算法的影响
- 科学计算，考虑浮点数（连续型变量）。我们的算法主要考虑离散型变量

### 设计算法的科学方式

#### 科学方法

科学家用来理解自然世界的方法对于研究计算机程序的运行时间同样有效。

1. 细致地*观察*真实世界的特点，通常还要有精确的测量
2. 根据观察结果提出*假设*模型
3. 根据模型*预测*未来的事件
4. 继续观察并*核实*预测的准确性
5. 如此*反复*指导确认预测和观察一致

科学方法的一条关键原则是我们设计的实验必须是*可重现的(Reproducible)*，这样他人可以验证假设的真实性（*证实*）。所有的假设必须是可*证伪*，这样我们才能确认某个假设是错误的，或需要修正。正如爱因斯坦的名言所说：“再多的实验也不一定能够证明我是对的，但只需要一个实验就能证明我是错的。”**我们永远也没法知道某个假设是否结对正确，我们智能验证它和我们的观察的一致性。**

#### 观察

我们的第一个挑战是如何定量测量程序的运行时间。每次运行程序都是进行一次科学实验，这个实验要回答一个问题：我的程序会运行多长时间。

我们对大多数程序的第一个定量观察就是：计算性任务的困难程度可以用*问题的规模*来衡量。一般，问题的规模可以是输入的大小，或某个命令行参数的值。根据直觉，程序的运行时间应该随着问题规模的增长而变长。

另一个定量观察是运行时间和输入本身无关，它主要取决于问题规模。

因此，我们重点研究如何更好地将问题规模和运行时间的关系量化。

例子：three sum

D.E.Knuth认为，尽管有许多复杂的因素影响着我们对程序运行时间的理解，原则上我们仍然可能构造出一个*数学模型*来描述任意程序的运行时间。Knuth的基本见解很简单，一个程序云讯的总时间主要和两点相关：

- 执行每条语句的好事
- 执行每条语句的频率

前者取决于计算机、语言编译器和操作系统，后者取决于程序本身和输入。

习惯上，将好用时间描述为输入规模的函数。但这依然不容易比较两个算法，如何比较相对速度（相同机器）？绝对速度（不同机器）？

### BIG IDEA: Aysmptotic analysis渐进性分析

渐进性分析：
1. 忽略与机器有关的因素
2. 考虑函数增长order of growth，即当$n->\infty , T(n)$时间的增长规模。

#### 函数增长与大O符号

设有函数$f(n) = n^2 + 2n + 1$，我们的问题是需要了解当n增长时，f(n)增长规模多少。

O用于描述函数增长的规模，即数量级order。

定义：令f和g为从整数集合或实数集合到实数集合的函数。我们说f(x)是O(g(x)),如果有常数C和k,使得x>k,就有
|f(x)|≤C|g(x)|。O(g(x))读作f(x)是大Og(x)。

换个写法就是
$$ \lim_{n \rightarrow \infty}{\frac{f(n)}{g(n)}} = C$$
C为常数，表明f(n)和g(n)是相同数量级的函数。这里面的观念在于，用函数来衡量另一个函数的增长规模。

例如： 张三身高多少？可以说他身高近两米，这是绝对度量。也可以说他和乔丹差不多高，这是**相对度量**。尽管相对度量没有准确定值，但可以给人们一个相对直观的概念，张三有多高。

这种想法有两个假设：
- 输入规模无限增长
- 尽管输入规模无限增长，但函数的增长规模存在相对的限制，不会超过某个数量级

例：证明$f(x)=x^2+2x+1, f(x)=O(n^2)$

证明：因为只要x>1，就有
	$$0≤x^2+2x+1≤x^2+2x^2+x^2=4x^2$$
	取C=4,k=1，本例可略绝对值号。
    
另一办法 ，注意在x>2时，$2x≤x^2$,于是，如果x>2,有
	$$0≤x^2+2x+1≤x^2+x^2+x^2=3x^2$$
	取C=3,k=2，证毕。
    
这里里面的观念是，$f(x)=x^2+2x+1$有可能大于$n^2$,比如$X^2$。但随着x趋于无穷，大于某个k后，总会存在那么一个常数C，使得$f(x) \leq Cx^2$。即趋于无穷后，f(x)的数量级，不大于$O(n^2)$。

注意：在f(x)是$O(x^2)$时,$x^2$可以被函数值大于$x^2$的任何函数取代，例如f(x)也是$O(x^3)$

张三身高和乔丹差不多，自然不会超过姚明了。

算法时间复杂性的大O估计，或说函数增长规模的渐进性度量，表达的是解题需要的时间如何随输入数据规模的增长而引起的规模变化多大。类似于孙悟空逃不出如来手掌心。任你输入规模如何变化（趋于无穷），总有个上界，函数增长规模是越不过去的。其中f(n)是算法的时间复杂性，g(n)是相对度量的参照函数。

注意：f(x)是O(g(x))的事实有时写作f(x)=O(g(x))。不过这一写法中的等号并不代表真正相等。这一记号说的是，**对于这些函数定义域中的足够大的数而言，函数f和g的值之间有个不等式成立。**

#### 常用结论

- 多项式常用于估计函数的增长，且多项式首项支配其增长。

用法：
1. 取公式最高次项
2. 丢掉低次项
3. 丢掉最高次项系数。

例：$3n^3 + 9n^2 - 5n -607 =(is) \Theta{(n^3)}$

- 组合函数的增长
例：并列程序语句
定理：$$f_1(x) is O(g_1(x)), f_2(x) is O(g_2(x)), then (f_1 + f_2)(x) is O(max (g_1(x), g_2(x)))$$
推论：$$f_1(x) and f_2(x) are both O(g(x)), then (f_1 + f_2)(x) is O(g(x))$$

- 复合函数的增长
例：嵌套程序语句
$$f_1(x) is O(g_1(x)), f_2(x) is O(g_2(x)), then (f_1 f_2)(x) is O(g_1(x)*g_2(x))$$

#### 除大O外还有一整套度量函数增长的符号
渐近意义下的记号：$O, \Omega, \Theta, o, \omega$ 

设f(N)和g(N)是定义在正数集上的正函数，即$\forall n，f(n) \ge 0，g(n) \ge 0$

- O的定义（渐进上界记号）：如果存在正的常数C和自然数$N_0$，使得当$N\ge N_0$时有$f(N) \leq Cg(N)$，则称函数f(N)当N充分大时上有界，且g(N)是它的一个上界，记为f(N)=O(g(N))。即f(N)的阶不高于g(N)的阶。

或写作$$O(g(n)) = \{ f(n) | 存在正常数c和n_0使得对所有n \ge n_0有：0 \leq f(n) \leq cg(n)\}$$


根据O的定义，容易证明它有如下运算规则：

    (1)O(f)+O(g)=O(max(f,g))；
    
    (2)O(f)+O(g)=O(f+g)；
    
    (3)O(f)O(g)=O(fg)；
    
    (4)如果g(N)=O(f(N))，则O(f)+O(g)=O(f)；
    
    (5)O(Cf(N))=O(f(N))，其中C是一个正的常数；
    
    (6)f=O(f)。 

 - $\Omega$的定义（渐进下界记号）：如果存在正的常数C和自然数$N_0$，使得当$N \ge N_0$时，有$f(N)\ge Cg(N)$，则称函数f(N)当N充分大时下有界，且g(N)是它
的一个下界，记为f(N)=Ω(g(N))。即f(N)的阶不低于g(N)的阶。

或写作：$$\Omega(g(n)) = \{ f(n) | 存在正常数c和n_0使得对所有n \ge n_0有：0 \leq cg(n) \leq f(n) \}$$

- $\Theta$的定义（紧渐进界记号）：定义$f(N)=\Theta(g(N))当且仅当f(N)=O(g(N))且$f(N)=\Omega (g(N))$。此时称f(N)与g(N)同阶。

或写作：$$ \Theta(g(n)) = \{ f(n) | 存在正常数c_1,c_2和n_0使得对所有n \ge n0有：c_1g(n) \leq f(n) \leq c_2g(n) \}$$

定理：$$ \Theta (g(n)) = O (g(n)) \land \Omega(g(n))$$

- o的定义（非紧上界记号）：对于任意给定的k＞0，都存在正整数$N_0$，使得
当$N \ge N_0$时有$\frac{f(N)}{Cg(N)} \leq k$,则称函数f(N)当N充分大时的阶比g(N)低，记为f(N)=o(g(N))。
    例如，$3N^2+4NlogN+7=o(4NlogN+7)$

或写作：
$$o(g(n)) = \{ f(n) | 对于任何正常数c>0，存在正数和n_0 >0使得对所有n \ge n_0有：0 \leq f(n)<cg(n) \}$$

这个定义等价于$$\lim_{n \rightarrow \infty}\frac{f(n)}{g(n)} = 0$$
    
- $\omega$定义（非紧下界记号）：
$$\omega(g(n)) = \{ f(n) | 对于任何正常数c>0，存在正数和n_0 >0使得对所有n \ge n_0有：0 \leq g(n) < f(n) \}$$

这个定义等价于$$\lim_{n \rightarrow \infty}\frac{f(n)}{g(n)} = \infty$$

推论：$$f(n) \in (g(n)) \Longleftrightarrow  g(n) \in o (f(n))$$ 

##### 渐进分析记号在等式和不等式中的意义
$f(n)= \Theta(g(n))$的确切意义是：$f(n) \in \Theta (g(n))$。
一般情况下，等式和不等式中的渐近记号(g(n))表示(g(n))中的某个函数。
例如：$2n^2 + 3n + 1 = 2n^2 + \Theta(n)$ 表示
$ 2n^2 +3n +1=2n^2 + f(n)$，其中f(n) 是$\Theta(n)$中某个函数。
等式和不等式中渐近记号$O, \Omega, \Theta, o, \omega$ 的意义是类似的。
