#  第15章 动态规划

动态规划(Dynamic Programming)中的"Programming"是指一种规划，而不是指写计算机代码。

#### 分治法和动态规划的差别
- **分治法**：讲问题划分成独立的子问题，递归的求解各子问题。
- **动态规划**：动态规划适用于子问题不是独立的情况，也就是各子问题包含了公共的子子问题。

在这种情况下，若用分治法则会做许多不必要的工作，即重复地求解公共的子子问题。动态规划算法对每个子子问题只求解一次，将其结果保存在一张表中，从而避免每次遇到各个子问题时重新计算答案。

动态规划通常应用与*最优解问题*

动态规划算法设计可以分为如下4个步骤：
1. 描述最优解结构
2. 递归定义最优解的值
3. 按自底向上的方式计算最优解的值
4. 由计算出的结果构造一个最优解

## 15.1 装配线调度


$2$ 条装配线: $i=1,2$

$n$个装配站，在每条装配线上：$j=1,2,...,n$

将装配线 $i$（ $i$ 为 $1$ 或 $2$ ）的第$j$个装配站表示为 $S_{i,j}$ ，装配线 $1$ 的第 $j$ 个站（ $S_{1,j}$ ）和装配线 $2$ 的第 $j$ 个站（ $S_{2,j}$ ）执行相同的功能。我们在把装配站 $S_{i,j}$ 上所需的装配时间记为 $a_{1,j}$ 。如下图所示，底盘进入装配线 $i$ 的进入时间为 $e_i$ ，装配完的汽车离开装配线 $i$ 的离开时间为 *x_i*。

从装配线 $i$ 上的装配站 $S_{i, j}$ 移走所花时间是 $t_{i,j}$，其中 $i=1,2$ ，而 $j=1,2,...,n-1$ （因为在第 $n$ 个装配站后，装配已经完成）。
![zhuangpeixiandiaodu](pics/zhuangpeixiandiaodu.png)

下图中，最快的总时间是选择装配线 $1$ 的装配站 $1$ ， $3$ 和 $6$ 。以及装配线 $2$ 的装配站 $2$ ， $4$ 和 $5$ 。
![zhuangpeixiandiaodu_2](pics/zhuangpeixiandiaodu_2.png)

### 步骤1：通过工厂最快路线的结构

为了解决这个问题，即寻找通过任一条装配线上的装配站 $j$ 的最快路线，我们解决它的子问题，即寻找通过两条装配线上的装配站 $j-1$ 的最快路线

### 步骤2：一个递归的解
### 步骤3：计算最快时间

```
FAST-WAY(a, t, e, x, n)

f1[1] <- e1 + a1,1
f2[1] <- e2 + a2,1

for j <- 2 to n
    if f1[j-1] + a1,j <= f2[j-1] + t2,j-1 + a1,j
    then f1[j] <- f1[j-1] + a1,j
         l1[j] <- 1
    else f1[j] <- f2[j-1] + t2,j-1 + a1,j
         l1[j] <- 2
    if f2[j-1] + a2,j <= f1[j-1] + t1,j-1 + a2,j
    then f2[j] <- f2[j-1] + a2,j
         l2[j] <- 2
    else f2[j] <- f1[j-1] + t1,j-1 + a2,j
         l2[j] <- 1

if f1[n] + x1 <= f1[n] + x2
then f* <- f1[n] + x1
     l* <- 1
else f* <- f2[n] + x2
     l* <- 2
```

### 步骤4：构造通过工厂的最快路线

```
PRINT-STATIONS(l, l*, n)
i <- l*
print "line" i ", station" n
for j <- n downto 2
    do i <- li[j]
        print "line" i ", station" j-1

```


## 15.1 钢条切割

![gangtiaojiagebiaoyangli](pics/gangtiaojiagebiaoyangli.png)

![gangtiaoqiegefangan](pics/gangtiaoqiegefangan.png)

最优化切割收益
$$r_m = max(p_n, r_1+r_{n-1}, r_2+r_{n_2},..., r_{n-1}+r_1)$$

钢条切割问题满足**最优子结构**(optimal substructure)性质：问题的最优解由相关子问题的最优解组合而成，而这些子问题可以独立求解。

动态规划有两种等价的实现方法，下面以钢条切割问题为例扎实这两种方法。
- **带备忘的自顶向下法**(top-down witm memorization): 此方法仍按自然的地柜形式编写过程，但过程会保存每个子问题的解(通常保存在一个数组或者散列表中)。当需要一个子问题的解时，过程首先检查是否保存过此解。如果是，则直接返回保存的值，从而节省了计算时间；否则，按照通常的方式计算这个子问题。我们称这个递归过程是**带备忘的**(memorized)，因为它"记住"了之前已经计算出的结果。
- **自底向上法**(bottom-up method)：这种方法一般需要恰当定义子问题"规模"的概念，使得任何子问题的求解都只依赖于"更小的"子问题的求解。因而我们可以将子问题按照规模排序，按照由小到大的顺序进行求解。当求解某个子问题时，它所依赖的哪些更小的子问题都已经求解完毕，结果已经八寸，每个子问题只需求解一次，当我们求解它(也是第一次遇到它)时，它的所有前提子问题都已求解完成。

两种方法具有相同的渐近运行时间，仅有的差异是在某些特殊情况下，自顶向下方法并未真正递归地考察所有可能的子问题。由于没有频繁的递归函数调用的开销，自底向上的时间复杂性函数通常具有更小的系数。

## 15.2 矩阵链乘法

矩阵的链乘法是完全满足结合律的，我们以矩阵链$<A_1, A_2, A_3>$相乘为例，来说明不同的加括号方式会导致不同的计算代价。假设三个矩阵的规模分别是 $1\times100, 100\times5, 5\times50$
- $((A_1A_2)A_3)$：为计算 $A_1A_2$(规模 $10\times5$ )，需要做 $10\cdot100\cdot5=5000$ 此标量乘法。再与 $A_3$ 相乘又要做 $10\cdot5\cdot50=2500$，总共需要7500此标量乘法
- $(A_1(A_2A_3))$：为计算 $A_2A_3$(规模 $100\times50$ )，需要做 $100\cdot5\cdot50=25000$ 此标量乘法。再与 $A_1$ 相乘又要做 $10\cdot100\cdot50=50000$，总共需要75000此标量乘法
因此第一种顺序计算矩阵链乘要比第二种顺序快10倍。