# Chapter-9 Dynamic programming(动态规划)

## 1. 背包问题及FAQ(Frequently asked question)

- ![](2022-02-18-12-36-14.png)

- 我们在前一章中已经学习了如何找到该问题的近似解，如何找到最优解呢？

### 1.1 运用动态规划解决问题

- 动态规划从小问题入手，逐步解决大问题。(合并两个子问题的解来得到更大问题的解)

- ![](2022-02-18-12-54-57.png)
  > 当前商品(current item)指这一行你需要购买的商品(行所代表的商品)！  
  
- ![](2022-02-18-12-55-21.png)

- 注意：沿着一列往下走时，最大价值**不可能**降低，每次迭代时，我们都存储当前的最大价值。最大价值不可能比以前低！

### 1.2 行的排列顺序发生变化时结果将如何

- 网格将类似于下面这样：  
  ![](2022-02-18-14-44-08.png)

- 答案不会发生变化。也就是说，各行的排列顺序无关紧要。

### 1.3 增加一件更小的商品将如何呢

- 由于项链的加入，我们需要考虑的粒度更细，因此必须调整网格。  
  ![](2022-02-18-14-54-37.png)

### 1.4 可以偷部分商品么

- 使用动态规划，要么考虑拿走整件商品，要么考虑不拿，而没法判断该不该拿走商品的一部分。
- 但使用贪婪算法，可以轻松地处理这种情况。首先尽可能多地拿价值最高地商品；如果拿光了，再尽可能多地拿价值次高地商品，以此类推。

### 1.5 贪婪算法和DP的区别：

- **动态规划**和**贪心算法**的共同点：
  - 都是一种递推算法，均有局部最优解来推到全局最优解。

- 贪婪算法：
  - 贪婪算法中，作出的每一步贪心决策都无法改变，因为贪心决策都是由上一步的最优解推导下一步的最优解，而上一步之前的最优解则不做保留。
  - 贪婪算法的正确条件：每一步的最优解一定包含上一步的最优解。

- DP(动态规划)算法：
  - 全局最优解中一定包含某个局部最优解，但不一定包含前一个局部最优解，因此需要记录之前的所有最优解。
  - 动态规划的关键是状态转移方程，即如何由已求出的局部最优解来推到全局最优解。
  - 边界条件：即最简单的，可以直接得出的局部最优解。

### 1.6 旅游行程最优化

- ![](2022-02-19-15-00-39.png)

- ![](2022-02-19-15-00-54.png)

### 1.7 处理相互依赖的情况

- ![](2022-02-19-15-02-26.png)

- 动态规划功能强大，它能够解决子问题并使用这些答案来解决大问题。但**仅当每个子问题都是离散的，即不依赖于其他子问题时，动态规划才管用**。这意味着使用动态规划算法解决不了从伦敦去巴黎玩的问题。

### 1.8 计算最终的解时会涉及两个以上的子背包么？

- 根据DP算法的设计，最多只需合并两个子背包，即根本不会设计两个以上的子背包。不过这些子背包可能又包含子背包。
  ![](2022-02-19-15-06-55.png)

### 1.9 最优解可能会导致背包没装满么？

- 完全可能，假设偷了一颗价值很高的钻石，就会出现这种情况。

## 2. 最长公共子串

- 动态规划和线性规划的区别：  
![](2022-02-19-15-23-12.png)

- DP问题的启示：
  - [ ] 动态规划可以帮助你在给定约束条件下找到最优解。在背包问题中，你必须在背包容量给定的情况下，偷到价值最高的商品。
  - [ ] 在问题可分解为彼此独立且离散的子问题时，就可以使用动态规划来解决。
      - 要设计动态规划解决方案可能很难，这正是本节要介绍的。下面会介绍一些通用的小贴士
  - [ ] 每种动态规划解决方案都涉及网格。
  - [ ] 单元格中的值通常就是我们要优化的值。在前面的背包问题中，单元格的值为商品的价值。
  - [ ] 每个单元格都是一个子问题，因此我们应该考虑如何将问题分成子问题，这有助于我们找出网格的坐标轴。

### 2.1 问题描述  

- ![](2022-02-19-15-30-35.png)

### 2.2 绘制网格

- 绘制解决问题的网格需要注意的地方：
  - [ ] 单元格中的值是什么？
  - [ ] 如何将这个问题划分为子问题？
  - [ ] 网格的坐标轴是什么？

- ![](2022-02-19-15-46-21.png)

### 2.3 填充网格

- **费曼算法** (Feynman algorithm)步骤：
  - [ ] 将问题写下来。
  - [ ] 好好思考。
  - [ ] 将答案写下来。

- 结论：有些算法并非精确的解决步骤，而只是帮助你理清思路的框架。

- ![](2022-02-19-15-50-50.png)

- ![](2022-02-19-15-51-08.png)

- 该公式的伪代码如下：

In [1]:
if word_a[i] == word_b[j]:
    cell[i][j] = cell[i-1][j-1] + 1
else:
    cell[i][j] = 0

NameError: name 'word_a' is not defined

- 需要注意的是：
  问题的最终答案并不在最后一个单元格中！对于前面的背包问题，最终答案总是在最后的单元格中。但对于长公共子串问题，答案为网格中最大的数字——可能并不位于最后的单元格中。

### 2.4 最长公共子序列

- 最长公共子串  
  ![](2022-02-19-16-02-33.png)

- 最长公共子序列：**两个单词中都有的序列包含的字母数。**  
  ![](2022-02-19-16-05-27.png)<br>
  ![](2022-02-19-16-06-18.png)

- 伪代码如下：

In [3]:
if word_a[i][j] == word_b[i][j]:
    cell[i][j] = cell[i-1][j-1] + 1
else:
    cell[i][j] = max(cell[i-1][j-1], cell[i][j-1])

NameError: name 'word_a' is not defined

- 动态规划的实际应用：
  - [ ] 生物学家根据最长公共序列来确定DNA链的相似性，进而判断两种动物或疾病有多相似。
    - 最长公共序列还被用来寻找多发性硬化症治疗方案。
  - [ ] 诸如"git diff"等命令，也是使用动态规划实现的。
  - [ ] 前面讨论了字符串的相似程度。编辑距离(levenshtein distance)指出了两个字符串的相似程度，也是使用动态规划计算得到的。编辑距离算法的用途很多，从拼写检查到判断用户上传的资料是否是盗版，都在其中。
  - [ ] 诸如Microsoft Word等具有断字功能的应用程序。在确定在什么地方断字以确保行长一致上，使用的也是动态规划。

## 3. 小结

- [ ] 需要在给定约束条件下优化某种指标时，动态规划很有用。
- [ ] 问题可分解为离散子问题时，可使用动态规划来解决。
- [ ] 每种动态规划解决方案都涉及网格。
- [ ] 单元格中的值通常就是你要优化的值。
- [ ] 每个单元格都是一个子问题，因此你需要考虑如何将问题分解为子问题。
- [ ] 没有放之四海皆准的计算动态规划解决方案的公式。