这一章让你熟悉我们在整本书里将使用的框架来思考算法设计和分析。它是自成体系的，但是也包含若干个引用到第3章和第4章里介绍的材料，也包含若干个求和式，在附录A中展示了如何求解这些求和式。

我们从检查第一章中提到的插入排序算法来求解排序问题。我们定义了伪代码，如果你做过计算机编程，则应该非常熟悉。我们使用伪代码来展示如何描述算法。我们先描述插入排序算法，后证明了插入排序的正确性，分析了它的运行时间。这种分析引入了一个重点关注时间如何随着待排序的项的数量而增加的记号。在讨论完插入排序后，我们介绍了算法设计的分而治之方法，使用它来开发归并排序。我们以分析归并排序的运行时间来结尾。

## 2.1 插入排序
我们的第一个算法是插入排序，它求解了在第一章中介绍的**排序问题**：

输入：一个由n个数组成的序列$<a_1,a_2,...,a_n>$。

输出：对输入序列的一个置换$<a_1^{'},a_2^{'},...,a_n^{'}>$满足$a_1^{'}\leq a_2^{'}\leq\cdots\leq a_n^{'}$。

我们希望排序的数也称为键key。虽然从概念上讲我们针对一个序列排序，但是输入是以由n个元素组成的数组呈现给我们的。

在这本书里，我们将算法描述为用**伪代码**编写的程序。伪代码跟C、C++、Java、Python等在许多方面很相似。如果你接触过任何一种编程语言，则你应该理解我们的程序没有困难。将伪代码和真实代码区分开的是：使用伪代码，我们利用的是一种最清晰、最精确的方法来描述一个给定算法。有时，最清晰的方法是英语，所以如果你在一个真实代码的节中碰到一个嵌入的英语语句，请不要惊讶。伪代码和真实代码的另一个区别是：伪代码不关心软件工程问题。为了更精确地表达算法的本质，通常会忽略数据抽象、模块化、错误处理等问题。

我们从**插入排序**开始，它是一个对小型输入有效的算法。

插入排序的工作方式跟人们对一手牌的排序方式一样。
- 最开始，我们的左手是空的，牌都是面查下放在桌子上。
- 然后，我们一次从桌子上拿起一张牌，将它插入到左手中合适的位置。

  为了找到一张牌的合适位置，我们将它和已经在左手里的每张牌进行比较，从左到右。
  
- 无论何时，在左手中的牌都是排好序的。这些牌原本是桌子上这堆牌的最上面的牌。

我们将插入排序的伪代码表示为`INSERTION_SORT`过程，它取一个由长度为n的待排序列组成的数组`A[1,2,...,n]`作为参数。这个算法原地对输入的数进行排序：它重排在数组A内的数字，在任何时候最多有常数个数位于数组外。当`INSERTION_SORT`过程完成后，输入数组A包含的是排好序的输出。

伪代码：
```
INSERTION-SORT(A)
  for j = 2 to A.length
      key = A[j]
      i = j - 1
      while i>0 and A[i]>key
          A[i+1] = A[i]
          i = i - 1
      A[i+1] = key
```

In [1]:
def insertionSort(A):
    """
    假设A是一个有n个数组成的数组
    """
    for j in range(1, len(A)):
        key = A[j]
        #将A[j]插入到已排好序的序列A[0...j-1]
        i = j-1
        while i>=0 and A[i]>key:
            A[i+1] = A[i]
            i = i-1
        A[i+1] = key
#         print(f'{key}的插入位置是{i+1}')
#         print(A[0:j])

In [2]:
def testInsertionSort():
    A = [5,2,4,6,1,3]
    insertionSort(A)
    print(A)

In [3]:
testInsertionSort()

[1, 2, 3, 4, 5, 6]


### 插入排序的循环不变性和正确性
图2.2中展示了这个算法如何对$A=<5,2,4,6,1,3>$排序。

索引`j`表示将要插入到手中的当前牌。

在以`j`为索引的for循环的每次迭代的开始，子数组`A[1...j-1]`表示的是当前已排好序的手，剩余的子数组`A[j+1...n]`表示还在桌子上的这堆牌。实际上，子数组`A[1...j-1]`中的元素最初是位置从1到`j-1`对应的元素，但是现在已排好序了。我们将`A[1...j-1]`具有的性质描述为**循环不变性**：
> 在第1-8行的for循环的每次迭代的开始，子数组`A[1...j-1]`最初由在`A[1...j-1]`的元素组成，但是现在已排好序。

我们使用循环不变性来帮助我们理解为什么一个算法是正确的。

对于一个循环不变性，我们要证明3个性质：
- 初始化：在第一次循环执行前，它为真；
- 维护性：如果在一次循环执行前，它为真，则在下一次循环执行前，它仍保持为真；
- 终止性：当循环终止时，不变性给我们一个非常有用的性质来帮助我们证明算法是正确的。

当前两条性质成立时，在循环每次迭代前，循环不变性为真。

第3条性质可能是最重要的，因为我们使用循环不变性了证明正确性。通常，我们使用带有循环终止条件的循环不变性。终止性使其跟我们使用的数学归纳法不同：在数学归纳法中，我们可以无限应用归纳步骤；在这里，当循环终止时，我们就停止归纳。

注意：这跟**数学归纳法**很相似，为了证明一个性质成立，我们需要证明一个基情形和一个归纳步骤。这里，证明循环不变性在第一次迭代前成立对应于**基情形**，证明从一个迭代到下一次迭代的不变性成立对应的是**归纳步骤**。

使用循环不变性来证明插入排序的正确性：

- 初始化性

  当j=2，在第一次循环执行前，子数组`A[1...j-1]`就只有1个元素，即`A[1]`，显然是排好序的。

- 可维护性

  `for`循环体的工作方式是：向右每次移动`A[j-1]`、`A[j-2]`、`A[j-3]`等一个位置直到找到`A[j]`的合适位置，并将`A[j]`的值插入到前述合适的位置处。子数组`A[1...j]`最初在`A[1...j]`中的元素组成，不过它已排好序。然后，`for`循环下一次迭代递增j仍保有循环不变性。

- 终止性

  引起`for`循环终止的条件是`j>A.length=n`。因为每次迭代时j都会自增1，所以当循环终止时，j=n+1。在循环不变性中用n+1替换j，我们有：`A[1..n]`由在`A[1..n]`中的元素组成，但是已排好序。注意到：`A[1...n]`是整个数组，所以整个数组已排好序。

## 2.2节算法分析

因此，我们的指导思想是真实计算机是如何被设计的。RAM模型包含有在真实计算机中都找得到的指令：算术指令(比如加法、减法、乘法、除法、取余、向下取整、向上取整等)，数据移动指令(加载、存储、拷贝等)，控制指令(条件跳转、无条件跳转、子例程调用、返回等)等。执行每个这样的指令都花费常数时间。

在RAM模型里的数据类型是整数和浮点数。虽然在这本书里我们不关心精度，但是在有些应用里精度很关键。比如，当处理大小为n的输入时，我们通常都假设整数可用$c\log n$位来表示，其中c是一个大于等于1的常数。我们要求$c\geq 1$是为了让每个字都能保存n的值，是我们能索引单个输入元素。我们要求c为常数，是为了保证字大小不能随意增长。如果我们允许字大小能随意增长，那么我们能在一个字里存储大量的数据，且在常数时间内完成对数据的操作。

真实计算机包含有一些上面没有列出的指令，这些指令表示RAM模型里的一个灰色区域。比如，幂运算是一个常数时间的指令吗？一般情况下，它不是，当x和y都是实数时，计算$x^y$需要花费多条指令。但是，在一些受限情况下，幂运算是一个常数时间操作。许多计算机都有一个左移指令，它在常数时间内将整数的位向左移动k位。在大部分计算机上，向左移动一位等价于乘以2，使得向左移动k位等价于乘以$2^k$。因此，这样的计算机可通过将整数1向左移动k位来用常数时间计算$2^k$，只要k不超过一个计算机字的位数大小。在RAM中，我们将尽力避免这些灰色区域，但是我们将把$2^k$的计算看做是一个常数时间的操作，当k是一个足够小的正整数时。

在RAM模型中，我们不尝试对在现代计算机中常见的内存层级建模。也就是说，我们不对缓存或者虚拟内存建模。有几个计算模型尝试去考虑内存层级的影响，这对在真实机器上真实程序来说是重要的。虽然本书在一撮问题里检查了内存层级的影响，但是大部分时候都不考虑它。包含内存层级的模型要比RAM模型更复杂一点，所以它们也更难处理。而且，RAM模型分析通常是实际机器性能的优秀的预测器。

即使用RAM模型分析一个简单的算法也可能是挑战。所需要的数学工具可能包括组合学、概率论、代数技巧、识别一个公式中最重要的项的能力等。因为一个算法的行为可能对每个可能输入都不同，所以我们需要一种方式来总结这种行为，即用简单且容易理解的公式。

即使我们通常会只选择一个机器模型来分析一个给定算法，在决定如何表示分析方面，我们仍然面临许多选择。我们想要一种方式：写起来和操作起来简单点、展示一个算法资源要求的重要特征、抑制烦人的细节。

### 分析插入排序

`INSERTION-SORT`过程花费的时间取决于输入：对1000个数排序比对3个数排序花费的时间要长。