# 2-3 動的計画法(DP)
    とは、一般に状態iから状態jに遷移するためのコストの表を作成し、表を参照・更新しながら最適解を求めていくような方法。 同じ値を何度も計算する無駄を省き、結果を表に残すことで効率的に計算する。

### 問題(ナップザック問題)
    価値が vi 重さが wi であるような N 個の品物と、容量が W のナップザックがあります。容量を超えないよう品物を選んでナップザックに入れるとき、勝ちの合計の最大値を出力せよ。
    1 ≤ N ≤ 100
    1 ≤ vi ≤ 1,000
    1 ≤ wi ≤ 1,000
    1 ≤ W ≤ 10,000
考え方：愚直な方法だとO(2^N)となり、指数関数的に計算量が増える。「メモ化」を用いた下の方法だとO(nW)までに減る(これは厳密にはDPではない。」。模範解答をみた。dp\[ i \]\[ j \]は、i番目以降から重さの総和がj以下となるように選んだときの価値の総和の最大値となっている。


In [1]:
# import
import numpy as np
import math
import random as rn
import itertools as it

In [2]:
# 入力　ランダム
N=rn.randint(1,100)
W=rn.randint(1,10000)
Vs=[]
Ws=[]
for i in range(N):
    Vs.append(rn.randint(1,1000))
    Ws.append(rn.randint(1,1000))

In [32]:
#　入力　サンプル
N=4
Ws=[2,1,3,2]
Vs=[3,2,4,2]
W=5

In [10]:
dp=[ [-1 for i in range(W+1)]  for j in range(N+1) ]
def rec(i,j):
    if dp[i][j] >= 0:
        return dp[i][j]
    if i == N:
        res = 0
    elif j < Ws[i]:
        res = rec( i + 1 , j )
    else:
        res = max( rec( i+1, j ) , rec( i + 1, j - Ws[i] ) + Vs[i] )
    dp[i][j] = res
    return  dp[i][j]
    
print( rec(0,W) )

7


次に、同じ問題の別解(漸化式）。この解き方の方が圧倒的にわかりやすい。O(nW)で計算量は同じ。厳密にはこれがDP。  
dp\[ N \]\[ j \] = 0  :  N番目以降から選ぶ方法は、常にゼロ  
dp \[ i \] \[ j \] = dp\[ i+1 \]\[ j \]   ... if j < w\[ i \]  
= max ( dp \[ i+1 \] \[ j \] , dp \[ i+1 \] \[ j - w \[ i \] \] + v \[ i \] ) ... otherwise  
この漸化式にしたがって、逆に k = N　から　0に向かってループを回して、最終的にdp \[ 0 \] \[ W \] を計算する方法。聞けばわかりやすいが、自力で解ける気がまだしない。

In [19]:
dp=[ [-1 for i in range(W+1)]  for j in range(N) ]
dp.append( [0 for i in range(W+1)] )
for i in range(0, N)[::-1]:
    for j in range(W+1):
        if j < Ws[i]:
            dp[i][j] = dp[i+1][j]
        else:
            dp[i][j] = max( dp[i+1][j] , dp[i+1][j-Ws[i]] + Vs[i])
print( dp[0][W])

7


逆に、「i番目までの商品を選んだときの価値の最大値」とすれば、順ループでかける。漸化式で書くときはこっちが自然か。

In [35]:
dp=[[0 for i in range(W+1)] ]
[dp.append(  [ -1 for i in range(W+1)]   ) for j in range(N) ]
for i in range(N):
    for j in range(W+1):
        if j < Ws[i]:
            dp[i+1][j]=dp[i][j]
        else:
            dp[i+1][j]=max( dp[i][j], dp[i][j - Ws[i]] + Vs[i]) 
print(dp[N][W])

7


### 問題(最長共通部分列)
    2つの文字列 s_1 ... s_n と t_1 ... t_mが与えられる。これらの2ツノ共通部分文字列の長さの最大値を求めよ。
    ただし、部分文字列とは、 s_i1 s_i2 ... s_ik (i1 < i2 < ... < ik )を満たす文字列のことである。
    1<= n,m <= 1000
考え方：さて、これは自力で解きたい。漸化式で考えよう。Sのi文字目までとTのj文字までの最長部分文字列をdp( i , j )としよう。
初期値：dp( 0 , j )=0, dp( i , 0)=0。もし、k文字目が一致していたら、 最長文字列は1文字のびる。一致していなかった場合、１文字前の最長部分文字列との最大値になる。
dp( i+1 , j+1) = dp( i, j )+1 ... S_i+1 = T_j+1
        ＝max ( dp( i+1, j) , dp( i , j+1 ) ) 
        
O(NM)。
  


In [48]:
#　入力　ランダム
alphabets="abcdefghijklmnopqrstuvwxyz"
N,M=rn.randint(1,1000),rn.randint(1,1000)
S,T="",""
for i in range(N):
    S+=alphabets[rn.randint(0,25)]
for i in range(M):
    T+=alphabets[rn.randint(0,25)]
print(N,S)
print(M,T)

458 xmdhzyxinhqubkrnkcyoixibcgvnljirgggplugiabotcfeuyrpyeidqjdcewvpdyasvbodybsjrdpwqzhsxgyriebfttaiobbfoctucouubfiovpnskrjqyraqphewaaekpoyslqunaspisljukvdgrxzjmiqumcjqingnhmdsevcbnyidgnhieadbuursudwjeiqomylfwaqkvxonucmywpmdoktvtybxizafbfikszlgvrllunlpebbtcrlfximvnbivuznoykfdmsqudvfqikhrngbwaaroreghsuibrxtzebovqlrzrbpkkenqgaufvqyzxyotikbtiffqqpyjrvrxnmtenzgqycjserrsxjeeuchvhtvqjbzjdqdifxlfdtczfpzabopheujsimytllroiysvcmgxrceycfmnqkpbhlgqeeslwuvhhxxwqoqguhtcztq
90 sltdzwmexaxcgxhymudraehnoqvoqadbawifdgzedlvraxlxcxfvehxzojflksdzrqgmcxcpfnedxpztgbdcdcvutf


In [50]:
#入力　サンプル
N,M=4,5
S="abcd"
T="becdx"

In [51]:
dp=[[ 0 for i in range( M+1 )] for j in range(N +1 )]
for i in range( N ):
    for j in range( M ):
        if S[ i ] == T[ j ]:
            dp[ i+1][ j+1 ] = dp[ i ][ j ] + 1
        else:
            dp[ i+1][ j+1 ] = max( dp[i+1][j] , dp[ i][ j+1 ] )
print(dp[N][M])

3


### 問題(個数制限なしナップザック問題)
    ナップザック問題と基本的には同じだが、各商品を荷物に入れる個数に制限がない場合の問題。
    1 ≤ N ≤ 100
    1 ≤ vi ≤ 1,000
    1 ≤ wi ≤ 1,000
    1 ≤ W ≤ 10,000
考え方：まず思いつくのは2重ループの中に、個数kのループも作って、最適な個数を選ぶ方法。だが、これではO(nW^2)で不十分。なので漸化式を式変形してO(nW)で解けるようにする。ここら辺は自力では無理で、解説・模範解答を読んでいる。  
漸化式についてだが、まず　愚直な方法では、  
dp ( 0 , j ) = 0  
dp ( i + 1 , j ) = max( dp ( i , j - k　×　w\[ i \] ) + k　×　v\[ i \]  for k >= 0 )  
と書き換わる。これをさらに式変形して、  
dp ( i + 1 , j ) = max( dp ( i , j - k　×　w\[ i \] ) + k　×　v\[ i \]  for k >= 0 )  
dp ( i + 1 , j ) = max( dp ( i , j ) ,    dp ( i , j - k　×　w\[ i \] ) + k　×　v\[ i \]  for k >= 1  )  
dp ( i + 1 , j ) = max( dp ( i , j ) ,    dp ( i , j - 　w\[ i \] - k　×　w\[ i \] +  k　×　v\[ i \]) + v\[ i \]  for k >= 0  )  
dp ( i + 1 , j ) = max( dp ( i , j ) ,    dp ( i + 1 , j - 　w\[ i \] ) + v\[ i \]  )  
となって、kループがなくなる。天才的な式変形だが、よく見ると、dp ( i + 1 , j - 　w\[ i \] ) + v\[ i \]  )  か　dp ( i  , j - 　w\[ i \] ) + v\[ i \]  )  かという違いだけ。それだけで個数1つか制限なしかが変わるとは。。。直感的にはわからない。ちゃんとテーブルを紙に書いて考えた方が良いのだろう。まだ理解できていないが、簡単な問題なら自力で解けるようになった気もする。まあとにかくこの問題のコードを書いておく。

In [1]:
#　入力　サンプル
N=3
Ws=[3,4,2]
Vs=[4,5,3]
W=7

In [2]:
dp=[[0 for i in range(W+1)] ]
[dp.append(  [ -1 for i in range(W+1)]   ) for j in range(N) ]
for i in range(N):
    for j in range(W+1):
        if j < Ws[i]:
            dp[i+1][j]=dp[i][j]
        else:
            dp[i+1][j]=max( dp[i][j], dp[i+1][j - Ws[i]] + Vs[i]) 
print(dp[N][W])

10


この章は残りの問題が難しいからひとまず次の章に進む。
まあ漸化式を使う基本は理解できた。。はず。。