### 钢条切割问题

摘录自：https://zhuanlan.zhihu.com/p/70763958

问题：Serling公司购买长钢条，将其切割为短钢条出售。假设切割工序没有成本，不同长度的钢条的售价如下：
![图一 钢条价格表](https://pic1.zhimg.com/80/v2-a2d0edf44393d61b06ea93b3fa2609b4_hd.png)

那么**钢条切割问题**就是：给定一段长度为$n$英尺的钢条和一个价格表为$p_i(i=1,2,...,n)$,求切割钢条方案，使得销售收益$r_n$最大（单位为元）。注意：如果长度为$n$英尺的钢条的价格 $p_n$足够大，那么最优解就是不需要切割。

**问题分析**：考虑 $n$ = 4 的情况，那么有以下几种切割方式：

1.切割为四段，长度为：1，1，1，1；总共卖4*1=4元。

2.切割为三段，长度为：1，1，2；总共卖2*1+1*5=7元。

3.切割为两段，长度为：1，3；总共卖1*1+1*8=9元。

4.切割为两段，长度为：2，2；总共卖2*5=10元。

5.不切割，长度为：4；总共卖1*9=9元。

长度为 $n$ 的钢条，总共有 $2^{n-1}$ 种不同的切割方案，因为长度为 $n$ 的钢条，总共有 $n$-1 个缝隙，每个缝隙都可以选择切或不切，所以有 $2^{n-1}$ 种不同切割方案。所以随着 $n$ 增大，切割方案总数呈指数级上升，遍历是不现实的。在这里，很容易想到，当要分析长度为 $n$ 的钢条的最优解时，可以先将钢条切成两段。将长度为 $n$ 的钢条随意切割的方案是 $2^{n-1}$ 种，但是只切两段的方案只有 $n$-1 种，这样规避了指数级计算量。将切成的两段，分别再当作子问题去求解，这就是如下分治策略解法：

In [1]:
#自顶向下递归实现 O(2^n)
class Solution:
    def cut_rod(self,n,p):
        if not n:
            return 0
        q=0
        for i in range(n):
            q=max(q,p[i]+self.cut_rod(n-i-1,p))
        return q
p=[1,5,8,9,10,17,17,20,24,30]
Solution().cut_rod(4,p)

10

上述方式包含大量的**重复运算**，如图：
![](https://pic2.zhimg.com/80/v2-8f01d48b606971496b207333534f15f9_hd.jpg)

In [5]:
#动态规划  带备忘录的自顶向下 O(n^2)
class Solution:
    def cut_rod(self,n,p):
        def dp(p,n,r):
            if r[n-1]>=0:
                return r[n-1]
            if n==0:
                q=0
            else:
                q=-1e10
                for i in range(n):
                    q=max(q,p[i]+dp(p,n-i-1,r))
            r[n-1]=q
            return q

        if not n:
            return 0
        #记忆下长度为1~n的钢条的最大收益，在后续处理中直接查表
        r=[-1e10]*n
        return dp(p,n,r)
p=[1,5,8,9,10,17,17,20,24,30]
Solution().cut_rod(4,p)

10

In [26]:
#动态规划  自底向上法(bottom-up)，不使用递归 O(n^2)
class Solution:
    def bu_cut_rod(self,n,p):
        if not n:
            return 0
        #记忆下长度为1~n的钢条的最大收益，在后续处理中直接查表
        r=[0]*(n+1)
        for j in range(1,n+1):
            q=-1e10
            for i in range(1,j+1):
                q=max(q,p[i]+r[j-i])
            r[j]=q 
        print(r) 
        return r[n]
p=[0,1,5,8,9,10,17,17,20,24,30]
Solution().bu_cut_rod(4,p)

[0, 1, 5, 8, 10]


10

In [29]:
#动态规划  保存切割方案 自底向上法(bottom-up)，不使用递归 O(n^2)
class Solution:
    def bu_cut_rod(self,n,p):
        if not n:
            return 0
        #记忆下长度为1~n的钢条的最大收益，在后续处理中直接查表
        r=[0]*(n+1)
        s=[0]*(n+1)
        for j in range(1,n+1):
            q=-1e10
            for i in range(1,j+1):
                if q<p[i]+r[j-i]:
                    q=p[i]+r[j-i]
                    s[j]=i
            r[j]=q 
        print(r) 
        while n>0:
            print(s[n])
            n=n-s[n]
        return r
p=[0,1,5,8,9,10,17,17,20,24,30]
Solution().bu_cut_rod(4,p)

[0, 1, 5, 8, 10]
2
2


[0, 1, 5, 8, 10]

### 矩阵连乘次数

[简书博文](https://www.jianshu.com/p/59f6fac01315)

$A$ 是一个 $p\times q$ 矩阵，$B$ 是一个 $q\times r$ 矩阵，$AB$ 相乘，得到的矩阵元素个数为$p\times r$ ，每个元素由 $q$ 次乘法得到，因此所需乘法次数为 $p\times q\times r$。

### 问题描述

在计算矩阵连乘积时，加括号的方式对计算量有影响。

例如有三个矩阵连乘$A_1,A_2,A_3$，它们的维数分别为$10 \times 100$
,$100 \times 5$,$5 \times 50$。用第一种加括号方式计算$(A_1A_2)A_3$，则所需数乘次数为$10 \times 100 \times 5 + 10 \times 5 \times 50 = 7500$。用第二种加括号方式计算$A_1(A_2A_3)$，需要次数乘$100 \times 5 \times 50 + 10 \times 100 \times 50 = 75000$ 次数乘。

输入连乘矩阵的个数，每个矩阵的维数。要求输出数乘次数最少时的加括号方式，及数乘次数。

输入：<br />
6<br />
30 35<br />
35 15<br />
15 5<br />
5 10<br />
10 20<br />
20 25<br />

输出：<br />
15125 <br />
((A1(A2A3))((A4A5)A6)) <br />

该问题有一个关键特征：计算矩阵链$A[1:n]$的最优计算方式，包含了子矩阵链$A[1:k]$和$A[k+1:n]$的最优计算方式。

一般地，如果原问题的最优解，包含了其子问题的最优解，则我们称这种性质为**最优子结构性质**。若问题具有最优子结构性质，则可用**动态规划**算法求解。
![](https://upload-images.jianshu.io/upload_images/11319118-4a6a85961b10939e.png?imageMogr2/auto-orient/strip|imageView2/2/w/538/format/webp)

### 递推公式
![](https://math.jianshu.com/math?formula=m%5Bi%2Cj%5D%3D%5Cbegin%7Bcases%7D%200%2C%20%26%20i%3Dj%20%5C%5C%20%5Cmin%5Climits_%7Bi%5Cleqslant%20k%20%3C%20j%7D(m%5Bi%2Ck%5D%2Bm%5Bk%2B1%2Cj%5D%2Bp_%7Bi-1%7Dp_kp_j%20)%2C%20%26%20i%3Cj%20%5Cend%7Bcases%7D)


In [35]:
#递推解法
class MatrixChainMul:
    def solve(self,n,A):
        if not n or n==1:
            return 0 
        q=1e10
        for i in range(1,n):
            q=min(q,self.solve(i,A[:i])+self.solve(n-i,A[i:])+A[0][0]*A[i-1][1]*A[-1][1])
        return q
n=6
inputs=[[30,35],[35,15],[15,5],[5,10],[10,20],[20,25]]
MatrixChainMul().solve(n,inputs)

15125

![](https://upload-images.jianshu.io/upload_images/11319118-c45036003626e4dd.png?imageMogr2/auto-orient/strip|imageView2/2/w/547/format/webp)

In [50]:
#DP 递推改记忆化 自顶向下法
class MatrixChainMul:
    def solve(self,n,A):
        def dp(A,m,i,j):
            if m[i][j]!=-1:
                return m[i][j]
            if j-i<=0:
                m[i][j]=0
                return 0
            q=1e10
            for k in range(i,j):
                q=min(q,dp(A,m,i,k)+dp(A,m,k+1,j)+A[i][0]*A[k][1]*A[j][1])
            m[i][j]=q
            return q
        m=[[-1]*n for _ in range(n)]
        res=dp(A,m,0,n-1)
        for row in m:
            print(row)
        return res
n=6
inputs=[[30,35],[35,15],[15,5],[5,10],[10,20],[20,25]]
MatrixChainMul().solve(n,inputs)

[0, 15750, 7875, 9375, 11875, 15125]
[-1, 0, 2625, 4375, 7125, 10500]
[-1, -1, 0, 750, 2500, 5375]
[-1, -1, -1, 0, 1000, 3500]
[-1, -1, -1, -1, 0, 5000]
[-1, -1, -1, -1, -1, 0]


15125

In [57]:
#DP 自底向上
class MatrixChainMul:
    def solve(self,n,A):
        m=[[0]*n for _ in range(n)]
        for j in range(1,n):#按列进行填充
            for i in range(j-1,-1,-1):
                q=1e10
                for k in range(i,j):
                    q=min(q,m[i][k]+m[k+1][j]+A[i][0]*A[k][1]*A[j][1])
                m[i][j]=q
        for row in m:
            print(row)
        return m[0][n-1]
n=6
inputs=[[30,35],[35,15],[15,5],[5,10],[10,20],[20,25]]
MatrixChainMul().solve(n,inputs)

[0, 15750, 7875, 9375, 11875, 15125]
[0, 0, 2625, 4375, 7125, 10500]
[0, 0, 0, 750, 2500, 5375]
[0, 0, 0, 0, 1000, 3500]
[0, 0, 0, 0, 0, 5000]
[0, 0, 0, 0, 0, 0]


15125

In [61]:
#DP 自底向上 记录位置
class MatrixChainMul:
    def solve(self,n,A):
        m=[[0]*n for _ in range(n)]
        s=[[0]*n for _ in range(n)]
        for j in range(1,n):#按列进行填充
            for i in range(j-1,-1,-1):
                q=1e10
                for k in range(i,j):
                    cur=m[i][k]+m[k+1][j]+A[i][0]*A[k][1]*A[j][1]
                    if q>cur:
                        q=cur
                        s[i][j]=k
                m[i][j]=q
        for row in m:
            print(row)
        def print_s(i,j):
            if i==j:
                return "A_"+str(i)
            else:
                le=print_s(i,s[i][j])
                ri=print_s(s[i][j]+1,j)
                return "("+le+ri+")"
        t=s[0][n-1]
        st=print_s(0,n-1)
        print(st)
        return m[0][n-1]
n=6
inputs=[[30,35],[35,15],[15,5],[5,10],[10,20],[20,25]]
MatrixChainMul().solve(n,inputs)

[0, 15750, 7875, 9375, 11875, 15125]
[0, 0, 2625, 4375, 7125, 10500]
[0, 0, 0, 750, 2500, 5375]
[0, 0, 0, 0, 1000, 3500]
[0, 0, 0, 0, 0, 5000]
[0, 0, 0, 0, 0, 0]
((A_0(A_1A_2))((A_3A_4)A_5))


15125

$((A_0(A_1A_2))((A_3A_4)A_5))$