【本周思路】本周通过进一步学习递归算法，引入动态规划的知识
* 408 引入分治策略的概念
* 409 介绍优化问题，和解决优化问题的贪心策略
* 410 找零问题【递归版本】
* 411 找零问题【动态规划版本】
* 412 动态规划的进一步案例
* 413 这两周的总结

**Table of contents**<a id='toc0_'></a>    
- [408 分治策略](#toc1_)    
  - [1. 分治策略：分而治之](#toc1_1_)    
  - [2. 递归算法与分治策略](#toc1_2_)    
- [409 优化问题和贪心策略](#toc2_)    
  - [1. 优化问题](#toc2_1_)    
  - [2. 贪心策略【每次都试图解决问题的尽量大的一部分】](#toc2_2_)    
- [递归解法解决找零问题](#toc3_)    
- [动态规划](#toc4_)    
- [博物馆大盗问题](#toc5_)    

<!-- vscode-jupyter-toc-config
	numbering=false
	anchor=true
	flat=false
	minLevel=1
	maxLevel=6
	/vscode-jupyter-toc-config -->
<!-- THIS CELL WILL BE REPLACED ON TOC UPDATE. DO NOT WRITE YOUR TEXT IN THIS CELL -->

# <a id='toc1_'></a>[408 分治策略](#toc0_)
## <a id='toc1_1_'></a>[1. 分治策略：分而治之](#toc0_)
当面临一个又大又复杂的问题，可以采用这个策略：
* 将问题分为若干更小规模的部分
* 通过解决每个小规模部分问题，并将结果汇总得到原问题的解

即：

![分治策略](./img/408.PNG)

## <a id='toc1_2_'></a>[2. 递归算法与分治策略](#toc0_)

* 递归算法是分治策略的一种【递归算法需要调用自身】，具体体现有：
    * 问题解决依赖于若干缩小了规模的问题
    * 汇总得到原问题的解
* 分治策略有广泛的应用【而且大多都是用递归算法来解决的】：
    * 排序
    * 查找
    * 遍历
    * 求值等

# <a id='toc2_'></a>[409 优化问题和贪心策略](#toc0_)
这一节重点：
* 什么是优化问题？
* 什么是贪心策略？

## <a id='toc2_1_'></a>[1. 优化问题](#toc0_)
计算机科学中许多算法都是为了找到某些问题的最优解，典型问题就是**兑换最少个数的硬币**:

假设你为一家自动售货机厂家编程序，要求自动售货机要每次找给顾客最少数量硬币

例如某次顾客投进$1纸币,买了ȼ37的东西,要找ȼ63,那么最少数量就是:2个quarter(ȼ25)，1个dime(ȼ10)和3个penny(ȼ1)，一共6枚

怎么算出来的？

$\implies$

## <a id='toc2_2_'></a>[2. 贪心策略【每次都试图解决问题的尽量大的一部分】](#toc0_)

* 从最大面值的硬币开始，用尽量多的最大面值
* 有余额的，再到下一最大面值的硬币，还用尽量多的这一面值，一直到penny（ȼ1）为止

也就是每次以**最**多数量的**最**大面值硬币来**最**快减少找零面值

但是！！这一策略在特殊情况下会翻车

$\implies$每一步都是最优的，并不代表结果是最优的

补充：

贪心策略能保证得到最优解的条件（需要同时满足）：
* 贪心选择性质： 问题的全局最优解可以通过一系列局部最优（贪心）选择来达到。这意味着做出局部最优选择后，剩下的子问题可以独立求解，且这个选择不会被后面的选择推翻
* 最优子结构： 问题的最优解包含了其子问题的最优解。也就是说，可以通过子问题的最优解来构造原问题的最优解（这是动态规划也需要的性质）

如果一个问题只满足最优子结构，但不满足贪心选择性质，那么贪心策略不能保证得到最优解（可能得到次优解），通常需要使用动态规划等其他方法（例如经典的0-1背包问题）

In [None]:
#使用贪心算法计算正常情况下的找零问题
lis = [1,5,20,50]
def change(lis,num):
    changelis = []
    for i in lis[::-1]:#按从后向前的顺序遍历列表，适用小规模，对大规模数据适合用reversed(lis)
        a = num // i
        num = num % i
        changelis.append(a)
    return changelis
print(change(lis,63))

# <a id='toc3_'></a>[410 找零问题【递归版】](#toc0_)

使用递归算法的思路来分析

1. 基本结束条件：
* 需要兑换的找零，其面值正好等于某种硬币，也就是1个硬币就能解决
* 当剩余金额小于0时：表示当前选择无效，返回特殊标记（如Infinity或-1）

优化说明：补充了金额小于0的边界条件，确保所有有效路径都能终止

2. 减小规模 & 调用自身
* 遍历每种硬币：对每个可用面额 ```coin```
* 减小规模：计算子问题金额 ```amount - coin```
* 调用自身：递归求解 ```minCoins(amount - coin)```
* 合并结果：取所有路径的最小值 ```min(1 + 递归结果)```

请注意：
* 递归调用的目的是获取子问题解
* 强调结果合并逻辑
* 每走一步都要计算把整个硬币体系刷一遍，还有大量的重复计算，极！其！低！效！

In [None]:
def recMC(coinValueList,change):
    minCoins = change #假设最多的硬币情况
    #排除有现成的情况【基本结束条件】
    if change in coinValueList:
        minCoins = 1
    else:
        for c in coinValueList:
            if c <= change:#去掉比余额大的硬币面额
                numCoins = 1 + recMC(coinValueList,change - c) 
                if numCoins < minCoins:
                    minCoins = numCoins
    return minCoins

In [None]:
print(recMC([1,5,10,25],63))

出现了大量重复计算，可以进行优化

$\implies$ 记录算过的面额的数据

![410](./img/410.PNG)

In [None]:
def recMCB(coinValueList,change,knownResult):
    #knownResult = {}#不能这么干，不然每次递归都会把这个字典新建了
    #教案实际上使用的是列表，也挺好
    
    minCoins = change
    if change in coinValueList:
        knownResult[change] = 1 #记录最优解；在这种情况下也不是一锤子买卖
        return 1#这个不能注释，会降低可读性【为啥不当场返回，还要依赖下面的elif】；也多了一次条件判断
    elif knownResult[change] > 0:
        return knownResult[change]
    else:
        for i in [c for c in coinValueList if c <= change]:
            numCoins = 1 + recMCB(coinValueList, change - i,knownResult)
            if numCoins < minCoins:
                minCoins = numCoins
                knownResult[change] = minCoins
    return minCoins

In [None]:
print(recMCB([1,5,10,25],63,[0]*64))

进一步优化代码，有

In [None]:
def recMCB(coinValueList, change, knownResult):
    # 边界条件：金额为0时返回0
    if change == 0:
        return 0
        
    # 1. 直接命中硬币面值
    if change in coinValueList:
        knownResult[change] = 1  # 记录最优解
        return 1  # 必须返回！
    
    # 2. 命中备忘录
    elif knownResult[change] > 0:
        return knownResult[change]
    
    # 3. 需要递归计算
    else:
        minCoins = change
        # 使用生成器表达式更高效
        for coin in (c for c in coinValueList if c <= change):
            numCoins = 1 + recMCB(coinValueList, change - coin, knownResult)
            if numCoins < minCoins:
                minCoins = numCoins
                knownResult[change] = minCoins  # 更新备忘录
        return minCoins

In [None]:
coins = [1, 5, 10, 25]
memo = [0]*64
print(recMCB(coins, 36, memo))  # 输出：3 (25+10+1)

使用字典数据来缓存，有

In [None]:
def recMCC(coinValueList, change, knownResult):
    # 边界条件：金额为0时返回0
    if change == 0:
        knownResult[0] = 0  # 记录0金额的解
        return 0
    
    # 检查备忘录是否已有结果
    if change in knownResult:
        return knownResult[change]
    
    # 直接命中硬币面值
    if change in coinValueList:
        knownResult[change] = 1  # 记录最优解
        return 1
    
    # 递归计算部分
    minCoins = change  # 可以使用float('inf')处理硬币体系不包含1的情况
    
    # 使用生成器表达式优化内存
    for coin in (c for c in coinValueList if c <= change):
        # 递归调用计算子问题
        numCoins = 1 + recMCC(coinValueList, change - coin, knownResult)
        
        # 更新最小硬币数
        if numCoins < minCoins:
            minCoins = numCoins
    
    # 记录结果到备忘录
    knownResult[change] = minCoins
    return minCoins

In [None]:
# 初始化备忘录（字典）
memo = {}

# 硬币面值列表
coins = [1, 5, 10, 25]

# 测试不同找零金额
print(recMCC(coins, 6, memo))    # 输出：2 (5+1)
print(recMCC(coins, 11, memo))   # 输出：2 (10+1)
print(recMCC(coins, 26, memo))   # 输出：2 (25+1)
print(recMCC(coins, 31, memo))   # 输出：3 (25+5+1)

# 查看备忘录内容
#print(memo)

#用21分找零63的结果也是正确的

* 以上是采取自顶向下的思路
* 但还算不上是动态规划，而是叫做memoization（记忆化/函数值缓存）
* DP的三大特征：最优子结构、重叠子问题、状态转移方程。特别是重叠子问题这点，正是递归改DP的关键判断依据

“带备忘录的递归”是从“想清楚怎么做”到“高效解决问题”的过渡方案，是自顶向下的动态规划，而不是全部的DP。它是连接递归思维和动态规划实现的桥梁

| 类型   | 实现方式        | 解释              |
| ---- | ----------- | --------------- |
| 自顶向下 | 递归 + 备忘录    | “带备忘录的递归” |
| 自底向上 | for 循环 + 表格 | 用数组/表格从小到大填答案   |

# <a id='toc4_'></a>[411 找零问题【动态规划版】](#toc0_)
动态规划算法采用了一种更有条理的方式来得到问题的解
* 找零兑换的动态规划算法从最简单的“1分钱找零”的最优解开始，逐步递加上去，直到我们需要的找零钱数【自底向上】
* 在找零递加的过程中，设法保持每一分钱的递加都是最优解，一直加到求解找零钱数，自然得到最优解

请注意：
* 递加的过程能保持最优解的关键是，其依赖于更少钱数最优解的简单计算，而更少钱数的最优解已经得到了【重叠子问题】
* 最优化问题能够用动态规划策略解决的必要条件：整个大问题的最优解，包含了更小问题的子问题的最优解【最优子结构】

$\implies$ DP的必要条件是：“重叠子问题 + 最优子结构”

1. 重叠子问题（Overlapping Subproblems）：
   
   在求解大问题时会反复用到相同的子问题答案，这样通过缓存（记忆化或表格存储）避免重复计算

2. 最优子结构（Optimal Substructure）：
   大问题的最优解能够通过其子问题的最优解递推得到，这是动态规划算法能正确工作的根本保证

**能拆能复用，DP才出众**【有表可查对DP是多么重要】

410递归中的这张图还可以再参考

![动态规划](./img/411.PNG)

以下是真实动态规划与递归的区别。动态规划的精髓是查表【复用】，递归的精髓是调用自身

首先制作动态规划的表格

![图片](./img/411_1.png)

查表，有

![图片](./img/411_2.png)

算法完成，开始实现！

In [None]:
def dpMakeChange(coinValueList,change,minCoins):
    for cents in range(change + 1):#制表，预测每个可能需要的找零面额
        #记录对应的最大硬币数量
        coinCount = cents
        for j in [c for c in coinValueList if c <= cents]:#确定会用到的每个零钱面额
            if coinCount > 1 + minCoins[cents - j]:#对表里的每个找零面额，都进行比较与计算
                coinCount = 1 + minCoins[cents - j]#统计，每次比较与更新
        minCoins[cents] = coinCount#结果进表
    return minCoins[change]

In [None]:
dpMakeChange([1,5,10,21,25],63,[0]*64)

思考如何优化代码。可以返回硬币组合吗？

可以。只需要在生成最优解列表同时跟踪记录所选择的那个硬币币值即可

In [1]:
def dpMakeChange(coinValueList,change,minCoins,coinsUsed):
    minCoins[0] = 0
    for cents in range(change + 1):
        coinCount = cents
        newCoin = 1
        for j in [c for c in coinValueList if c <= cents]:
            if minCoins[cents - j] + 1 < coinCount:
                coinCount = minCoins[cents - j] + 1
                newCoin = j
        minCoins[cents] = coinCount
        coinsUsed[cents] = newCoin#每一步都必然只加了一个硬币
    return minCoins[change]


In [2]:
def printCoins(coinsUsed,change):
    coin = change
    while coin > 0:
        thisCoin = coinsUsed[coin]
        print(thisCoin)
        coin = coin - thisCoin

In [3]:
amnt = 63
clist = [1,5,10,21,25]
coinsUsed = [0]*(amnt+1)  # 存储硬币面值
coinsCount = [0]*(amnt+1)  # 存储硬币数量

# 执行计算
min_coins = dpMakeChange(clist, amnt, coinsCount, coinsUsed)
print(f"最少硬币数: {min_coins}")  # 应输出 3

# 回溯硬币组合
print("硬币组合:")
printCoins(coinsUsed, amnt)  # 应输出 21,21,21

最少硬币数: 3
硬币组合:
21
21
21


在这个问题中，带备忘录的递归和DP算法均基于最优子结构（每个金额的解依赖子问题解）

也就是使用状态转移方程

$$minCoins[i] = min(minCoins[i], minCoins[i - coin] + 1)$$

DP最主要的思想是
* 从最简单的情况开始，达到所需找零的循环【课件认可自底向上】
* 每一步都依靠以前的最优解来得到本步骤的最优解，直到得到答案

请注意所有DP都能改写成记忆化递归，但递归不一定能DP优化

AI提出另一种理解角度，而不是只认可自底向上

* 递归 + 备忘录 = 自顶向下的 DP： 从大问题开始，分解成小问题，递归求解并缓存结果
* 迭代 + DP 表 = 自底向上的 DP： 从小问题开始，迭代求解并逐步构建大问题的解

两者都是动态规划的有效实现方法，都利用了“存储子问题解以避免重复计算”的核心思想。选择哪种方式取决于具体问题和个人偏好。自顶向下更“自然”，自底向上通常更高效（尤其是在空间优化后）。

许多问题可以同时用两种方式实现，斐波那契数列、背包问题、最长公共子序列等都是经典的例子。理解这两种视角对于掌握动态规划至关重要

# <a id='toc5_'></a>[412 0/1背包问题【递归与动态规划两个角度解决】](#toc0_)
![图片](./img/2.png)

贪心策略明显不行了，先从动态规划角度解决

从数学上，不妨当作求解函数最优解，那么设计函数有：

![pic](./img/3.png)

* 状态转移公式是基于上一步考虑的，也就是完成i-1以后，第i件东西加不加。可能等于$m(i-1,W)$是因为第i件没加进去，重量也没变；可能等于$m(i-1,W - W_i)+v_i$，因为加号左边是上一步的价值，右边是这一步的价值。这是描述限制条件（物品情况，重量）中，到手价值最大的函数
* 为什么$w_i > W$就不加了？因为这个函数描述的就是整体组合重量不超过W的情况，超过了就绝对加不进来
* i并不是物品编号，而是前i个，是可以改变的
* 适合由底到顶的思路

列出来表格有

请注意每个格依赖的都跟左边或者上边的有依赖关系

![pic](./img/4.png)

举例： $m(5,5)$

* $i = 5$的时候，重量为9，超过$W= 5$的限制，肯定不选，因此它等于$m(4,5)$【这个物品超重了，其他的都扔掉也选不了它】
* $m(4,5)$时，第4件的重量为5，没有超过限制，因此第4件可以进入选择【有，或者没有】它等于$max(m(3，5),m(3,0)+8)$。前者是不选这玩意儿，后者是要选这玩意儿的话，上一步该把背包倒成啥样


理论描述完毕，开始实现

In [1]:
tr = [None,{'w':2,'v':3},{'w':3,'v':4},{'w':4,'v':8},{'w':5,'v':8},{'w':9,'v':10}]#None是用来占位的

max_w = 20

In [13]:
""""
dp

"""
#制表
m = {(i,w):0  for i in range(len(tr)) for w in range(max_w + 1)}#有趣的初始化写法；这个东西其实是价值函数;key是元组

#填表
for i in range(len(tr)):
    for w in range(max_w + 1):
        if i == 0 or w == 0:#不判断也不要紧，毕竟生成表格的时候就是0了
            m[(i,w)] = 0
        elif tr[i]['w'] > w:#第i件超重的话
            m[(i,w)] = m[(i-1,w)]
        else:
            m[(i,w)] = max(m[(i-1,w)],m[(i-1,w-tr[i]['w'])]+tr[i]['v'])

In [None]:
max_value = max(m.values())
print(max_value)
# 获取所有达到最大值的键（可能有多个）
max_keys = [key for key, value in m.items() if value == max_value]

# 遍历并输出每个最大键对应的 i 和 w
for (i, w) in max_keys:
    print(f"i: {i}, w: {w}")

29
i: 5, w: 20


In [None]:
#dp
#without function
tr = [None,{'w':2,'v':3},{'w':3,'v':4},{'w':4,'v':8},{'w':5,'v':8},{'w':9,'v':10}]

max_w = 20

m = {(i,w):0 for i in range(len(tr))
                for w in range(max_w + 1)}
#print(m.items())
for i in range(1,len(tr)):
    for w in range(1,max_w + 1):
        if tr[i]['w'] > w:
            m[(i,w)] = m[(i-1,w)]
        else:
            m[(i,w)] = max(
                m[(i-1,w)],
                m[(i-1,w-tr[i]['w'])] + tr[i]['v']
            )

print(m[(len(tr)-1,max_w)])#这个必然是最大的，很巧妙

29


现在把递归的方式搞了，要点是：
* 基本结束情况
* 减小规模【干脆从列表中踢出去，backwards】
* 调用自身

也就是每选一步，都要看看上一步干的啥。这是自顶向底的思路

记得递归必须回原点！

In [None]:
def knapsack(i, w):#表示从第 1~i 个物品中选择，且背包剩余容量为 w 时,最大可获得的价值
    if i == 0 or w == 0:
        return 0
    if tr[i]['w'] > w:
        return knapsack(i-1, w)
    else:
        return max(knapsack(i-1, w), knapsack(i-1, w - tr[i]['w']) + tr[i]['v'])

# 示例调用
print(knapsack(len(tr) - 1, 20))  # 输出最大价值


29


加上备忘录，那么有：

In [None]:
def knapsack(i,w):

In [None]:
#课堂代码，递归+备忘录
#通过遍历所有可选物品，找出 当前递归层 的最大价值
#背包问题的重点是选哪些物品，而不是物品的顺序，因此无序的描述物品方式也不干扰递归结果
tr = {(2,3),(3,4),(4,8),(5,8),(9,10)}#这玩意儿是没有顺序的，全靠转成元组描述是啥物品，而不是序号
max_w = 20

m = {}#集合

def thief(tr,w):#tr用backwards处理，w是剩余承重
    if tr == set() or w == 0:#基本结束条件
        m[(tuple(tr),w)] = 0#字典填写
        return 0#这里返回了0
    
    elif (tuple(tr),w) in m:#查记录
        return m[(tuple(tr),w)]
    
    else:
        vmax = 0#forwards处理价值函数
        for t in tr:#虽然集合没有顺序，但已经选择的物品是被踢掉了
            if t[0] <= w:#t[0]是重量，t[1]是价值
                v = thief(tr - {t},w - t[0]) + t[1]#看看上一步；w在这里更新了，因为递归调用
                vmax = max(vmax,v)
        m[(tuple(tr),w)] = vmax
        return vmax
print(thief(tr,max_w))

29


假设当前状态：

* 物品集合 tr = {(3,4), (4,8)}（重量,价值）
* 剩余承重 w = 5

那么计算过程有

1. 取物品 t = (3,4)（重量3≤5，可选）：
        递归计算子问题：thief({(4,8)}, 5-3=2)
        子问题：重量限制2，只能选 (4,8)？但4>2，无法选择 → 返回0
        v = 0 + 4 = 4
        更新 vmax = max(0, 4) = 4

2. 取物品 t = (4,8)（重量4≤5，可选）：
        递归计算子问题：thief({(3,4)}, 5-4=1)
        子问题：重量限制1，无法选 (3,4)（3>1） → 返回0
        v = 0 + 8 = 8
        更新 vmax = max(4, 8) = 8

所以最终返回 vmax = 8（选择物品 (4,8) 是最优解）


函数 ```thief(tr, w)``` 是通过循环```for t in tr```遍历每个物品 t：
对于每个物品 t，如果其重量 ```t[0] <= w```，它递归计算选择 t 后的价值
```thief(tr - {t}, w - t[0]) + t[1]```（即移除 t 并减少重量）。
然后，通过 vmax = max(vmax, v) 比较所有可能的选择，保留最大值。
这相当于枚举所有子集

In [18]:
for t in tr:
    print(t[1])

10
3
4
8
8


In [None]:
tr = [None,{'w':2,'v':3},{'w':3,'v':4},{'w':4,'v':8},{'w':5,'v':8},{'w':9,'v':10}]#None是用来占位的

max_w = 20

In [None]:
#递归写法加备忘录
m = {}#跟dp换了个方式；备忘录
def thief(tr,w):#dp没定义函数
    if tr == set() or w==0:#前面
        m[tuple(tr)]