# 第一章 算法分析和面向对象程序设计

本课程的主要内容和目的是
+ 编程的基础: 数据结构 + 算法;
+ C++ 和面向对象编程, 课本到 C++ 11 标准, 我们可以适当引入一些 11 以后的标准;
+ 离散数学, 算法分析和证明; 但这部分主要靠自己看, 相信大家良好的数学基础; 
+ 实际编程训练;
+ 熟练使用计算机从事科学计算和学习, 为后续课程打好基础.


**算法** 算法是一个详细的、定义明确的、能够解决特定问题的、有限长度的步骤序列。每个算法的步骤都应该是清晰且不含歧义的，具有准确性、可执行性和有限性。 流程明确且预测性强是算法的一个重要特征，即给定相同的输入，无论何时运行算法，输出都应始终相同。 算法可以用于执行计算、数据处理、自动推理等任务，是计算机科学中的基本概念。

**例子** 给你 $n$ 个数, 求其中第 $k$ 大的数($n \geq k$). 这个例子经常被称为 **rank$-k$ 问题**,在很多实际应用当中是关键的一步. 

**例子** 单词迷宫; 这是老外非常爱玩的游戏. 我们人类就是执行朴素算法的. 我们会扫视一个布满字母的矩阵的每一行, 每一列和每一斜列, 看看是否有片段和我们记忆中的单词匹配. 

**学习目标:**(之一) 写出效率正确的算法. 

## 算法分析简介

我们明确一些符号约定:
+ 称 $T(N) = O(f(N))$, 如果存在正常数 $c$ 和 $n_0$,
  使得当 $N \geq n_0$ 时, 有 $T(N) \leq cf(N)$.
+ 称 $T(N) = \Omega(g(N))$, 如果存在正常数 $c$ 和 $n_0$,
  使得当 $N \geq n_0$ 时, 有 $T(N) \geq cg(N)$.  
+ 称 $T(N) = \Theta(h(N))$, 当且仅当 $T(N) = O(h(N))$ 且 $T(N) = \Omega(h(N))$.  
+ 称 $T(N) = o(p(N))$ 对于所有的正常数 $c$,
  如果存在 $n_0$ 使得当 $N > n_0$ 时有 $T(N) < cp(N)$.
  不那么正式地说, 如果 $T(N) = O(p(N))$ 且 $T(N) \neq \Theta(p(N))$,
  则 $T(N) = o(p(N))$.

**阶的运算法则**

- 如果 $T_1(N) = O(f(N))$ 和 $T_2(N) = O(g(N))$, 那么
  + $T_1(N) + T_2(N) = O(f(N) + g(N))$;
  + $T_1(N) * T_2(N) = O(f(N) * g(N))$.

- 如果 $T(N)$ 是 $k$ 次多项式, 那么 $T(N) = \Theta(N^k)$.  

- 对于任意常数 $k$, 有 $\log^k N = O(N)$.

在实际工作中, 即便是抽象运行时间或者代价, 也是分场合的. 我们这里强调两个特殊含义的 $T(N)$:
+ **最坏情形时间** $T_{\rm worst} (N)$, 它是默认的含义;
+ **平均情形时间** $T_{\rm avg}(N)$, 它本质上是指在某基本假设下,
比如所有可能情形都等概率发生, 在这一前提假设下的期望时间. 这给估计带来一定的挑战,
但是有时也是有显著参考意义的一个指标.

而所谓的*最佳情形时间* $T_{\rm best}(N)$, 通常是没有意义的. 因为 
+ $T_{\rm worst} (N)$ 是一种保证; 
+ $T_{\rm avg} (N)$ 是一种估计; 而
+ $T_{\rm best}(N)$ 只是一个特例.

以后, 我们用抽象时间或者时间复杂度来称呼 $T(N)$.

**递归简介**

在数学描述或证明一个和自然数有关的问题时(因为是离散的, 所以和自然数相关),
我们经常采用两种不同的策略. 
+ 直接建立和自然数集的一一映射,
比如直接给出一个序列的通项: $a_n = f(n)$, 只要 $f$
是可以用基本初等函数的有限形式表达的, 我们就可以容易地用编程语言写出这个序列的生成程序.
+ 递推形式:
\begin{equation}
  \left\{
  \begin{array}{rcl}
    a_{n + 1} &=& f(a_n), \\
    a_1 &=& f_1. 
  \end{array}\right.
  \label{eq::recursion_formula}
\end{equation}

用编程语言的函数形式实现这种递推公式的生成,
要求该编程语言能够实现一个基本的功能: 函数能自己调用自己. 

一个朴素的伪代码形式实际上可以如此表达:
```
function a(n)
    if n == 1
        return f1
    else
        return f(a(n - 1))
end
```

为了引入递归的算法的抽象算法时间估计的讨论, 我们看这个例子:  
```
Merge(A, p, q, r)
  n1 = q - p + 1
  n2 = r - q 
  L[1...(n1 + 1)]
  R[1...(n2 + 1)]
  for i = 1 to n1
    L[i] = A[p + i - 1]
  for j = 1 to n2
    R[j] = A[q + j]
  L(n1 + 1) = R(n2 + 1) = +inf
  for k = p to r
    if L[i] <= R[j]
      A[k] = L[i]
      i = i + 1
    else
      A[k] = R[j]
      j = j + 1
```

这个例子的功能是, 假设数组 `A` 的 `A[p...q]` 和 `A[q + 1...r]` 是已经排好序的, 
那么经过这个 Merge 过程之后, `A[p...r]` 都是有序的. (注: 我们默认有序都是升序. 且可重复. )
这个过程的时间复杂度是 $O(n)$, 其中 $n = r - p + 1$.

在这个例子的基础上, 我们可以构建一种排序算法, 归并排序(Merge Sort), 它的伪代码如下:
```
  MergeSort(A, p, r)
    if p < r
      q = (p + r) / 2
      MergeSort(A, p, q)
      MergeSort(A, q + 1, r)
      Merge(A, p, q, r)
```
注意这里的 `/` 运算要做下取整. 它的功能是对 `A[p...r]` 进行排序. 这是一个实际上被广泛使用的算法. 
我们可以给一个具体的输入来验证一下它的有效性.

我们注意到, 如果假设 MergeSort 的复杂度是 $T(N)$, 在这里 $N = r - p + 1$, 
那么每一次递归调用都是 $T(N / 2)$, 而 Merge 过程的复杂度是 $O(N)$, 所以我们可以把整个复杂度写成:
\begin{equation}
  T(N) = \left\{
    \begin{array}{ll}
      O(1), & N = 1, \\
      2 T(\frac{N}{2}) + O(N), & N > 1.
    \end{array}
  \right.
\end{equation}
于是复杂度本身也是一个递推公式, 我们可以用递归树来描述它的求解过程.

注意, 尽管这里我们通过递归树得到了一个 $O(N \log N)$ 的复杂度, 但这个复杂度的求解过程并不是很严格.
而严格的证明, 则需要用数学归纳法. 同学们可以自行尝试.