### 案例

一维滚动 0-1背包

In [None]:
# 物品重量和价值
weights = [10, 20, 30]
values = [60, 100, 120]
capacity = 50

# 初始化：dp[j] 表示容量为 j 时的最大价值
dp = [0] * (capacity + 1)

# 遍历每一个物品
for i in range(len(weights)):
    print(f'i = {i}: ', len(dp), dp)
    w = weights[i]
    v = values[i]
    # 倒序遍历容量，确保每个物品只用一次
    for j in range(capacity, w - 1, -1):
        dp[j] = max(dp[j], dp[j - w] + v)

# 最终答案
print("最大价值是：", dp[capacity])
print(dp)


i = 0 51 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
i = 1 51 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60]
i = 2 51 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160]
最大价值是： 220
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 160, 160, 160, 160, 160, 160, 160, 160, 160, 160, 180, 180, 180, 180, 180, 180, 180, 180, 180, 180, 220]


两个约束：重量 + 体积

In [None]:
def knapsack_2d(m, n, w, v, c):
    dp = [[0] * (n + 1) for _ in range(m + 1)]
    for k in range(len(w)):  # 遍历每个物品
        wi, vi, ci = w[k], v[k], c[k]
        # 逆向遍历防止重复选择（假设物品不可重复）
        for i in range(m, wi - 1, -1):
            for j in range(n, vi - 1, -1):
                if dp[i - wi][j - vi] + ci > dp[i][j]:
                    dp[i][j] = dp[i - wi][j - vi] + ci
    return dp[m][n]

In [None]:
# 物品参数（N=100个物品）
N = 100
m, n = 1000, 1000  # 背包容量
w = [random.randint(1, 100) for _ in range(N)]  # 重量
v = [random.randint(1, 100) for _ in range(N)]  # 体积
c = [random.randint(10, 100) for _ in range(N)]  # 价值

### 动态规划的优化方法

#### 一、时间优化
1. 裁剪状态空间
2. 记忆化搜索（Memoization）
3. 状态转移优化
   - 前缀和优化（子数组和类问题）
   - 单调队列（滑动窗口最大/最小）
   - 决策单调性 + 二分搜索
   - 四边形不等式优化（区间DP）
   - 斜率优化（凸包 Trick）
4. 二进制优化（多重背包拆分）

#### 二、空间优化
5. 滚动数组（维度压缩）
6. 状态压缩（如 bitmask 状态合并）
7. 稀疏状态用哈希表/字典存储

#### 三、实现策略
8. Tabulation（表填充） vs 记忆化搜索



In [11]:
import time

In [6]:
w = [2, 1, 3]
v = [4, 2, 3]
W = 4


In [12]:
# 记忆化搜索
from functools import lru_cache
start = time.perf_counter()

def knapsack_memo(w, v, W):
    n = len(w)

    @lru_cache(None)
    def dfs(i, capacity):
        if i == n:
            return 0
        # 不选当前物品
        res = dfs(i + 1, capacity)
        # 选当前物品（如果装得下）
        if capacity >= w[i]:
            res = max(res, dfs(i + 1, capacity - w[i]) + v[i])
        return res

    return dfs(0, W)

print(knapsack_memo([2, 1, 3], [4, 2, 3], 4))  # 输出：6
end = time.perf_counter()
print(f"Memoization time: {end - start:.6f} seconds")



6
Memoization time: 0.000478 seconds


表格填充（二维）

In [13]:
start = time.perf_counter()
def knapsack_dp(w, v, W):
    n = len(w)
    dp = [[0] * (W + 1) for _ in range(n + 1)]

    for i in range(1, n + 1):  # 考虑前i个物品
        for j in range(W + 1):  # 背包容量j
            if j < w[i - 1]:
                dp[i][j] = dp[i - 1][j]  # 装不下
            else:
                dp[i][j] = max(
                    dp[i - 1][j],                          # 不选
                    dp[i - 1][j - w[i - 1]] + v[i - 1]     # 选
                )
    # print(dp)
    return dp[n][W]

print(knapsack_dp([2, 1, 3], [4, 2, 3], 4))  # 输出：6
end = time.perf_counter()
print(f"Tabulation time: {end - start:.6f} seconds")


6
Tabulation time: 0.000465 seconds


## ANN approximation

思考：
1. 什么场景下需要ANN近似求解

    1）大规模输入（如上万物品）

    2）复杂约束：有些背包问题的约束是非标准的（比如物品间的依赖、互斥、组合规则），ANN避免显示建模

    3）不可微/不规则目标的策略学习：多轮决策、动态变化资源

    4）在启发式算法（如蒙特卡洛树搜索、剪枝搜索、模拟退火）中， ANN 可以用作估价函数，快速评估某状态的“潜在价值”，辅助搜索方向

2. 用什么类型/特点的ANN可能可以满足要求

    1）定长物品列表：MLP

    2）变长物品列表：Transformer

3. 输入和输出可以是什么

    1）Pure ANN：输入所有物品信息和容量，直接预测整体解
    
    2）Hybrid DP + ANN（对于部分代价高的子问题（例如状态空间大或计算慢），用 ANN 进行近似预测；其余子问题继续使用经典 DP 递推，保证精度）：
    
4. 怎么体现优化的程度

    1）inference time：单个实例用 ANN 推理的时间 vs 用 DP / ILP 解的时间

    2）speedup ratio：传统算法耗时 / 神经网络推理耗时

5. 怎么保证解的质量

    1）Approxiamation ratio:ANN 预测解的价值 / 最优解的价值（DP or ILP）

    2）MSE/MAE

    3）Feasible Rate: 在预测中有多少比例的解满足背包容量约束

6. 训练的数据来源

In [None]:
import numpy as np

# 生成 0-1 背包 DP 训练数据
def knapsack_dp(weights, values, W):
    n = len(weights)
    dp = np.zeros(W + 1)
    
    for i in range(n):
        for j in range(W, weights[i] - 1, -1):
            dp[j] = max(dp[j], dp[j - weights[i]] + values[i])

    return dp  # 返回 DP 表

# 生成随机背包问题的数据
np.random.seed(42)
weights = np.random.randint(1, 10, 10)
values = np.random.randint(10, 100, 10)
W = 50

dp_table = knapsack_dp(weights, values, W)
X_train = np.array([[w, v, W] for w, v in zip(weights, values)])
y_train = dp_table[weights]  # 训练标签：对应 DP 结果


In [None]:
import tensorflow as tf
from tensorflow import keras

# 设计神经网络
model = keras.Sequential([
    keras.layers.Dense(16, activation='relu', input_shape=(3,)),
    keras.layers.Dense(16, activation='relu'),
    keras.layers.Dense(1)  # 预测 DP 值
])

model.compile(optimizer='adam', loss='mse')
model.fit(X_train, y_train, epochs=500, verbose=0)

# 用神经网络预测 DP 结果
print(model.predict([[5, 60, 50]]))  # 预测 DP 值
