### 简单动态规划（超时）
* 第一层动态规划（最多一次交易）：
    * dp[i] = max(dp[i-1], dp[i] - dp[j])，0<=j<=i
        * 第 i 天的最大收益 = max（第 i-1 天的最大收益，第 j 天（遍历）买入第 i 天卖出的最大收益）
        * 若为第一种情况，表示未进行交易
        * 若为第二种情况，表示进行交易且收益大于前一天的最大收益
* 第二层动态对话（最多两次交易）：
    * 第二层动态规划需要在第一层动态规划的基础上进行，即上一层动态规划的值为 dp[1][:]（dp[0][:]=0，为占位符，方便计算）
    * 初始化，dp[2][i] = max(dp[2][i-1], prices[i]-prices[0])
        * 第一种情况，表示并未进行交易，初始最大值为前一天的最大值
        * 第二种情况，表示第 0 天买入，第 i 天卖出的收益，且大于前一天的最大收益
    * 遍历第 j 天买入第 i 天卖出的收益，进一步确定 dp[2][i] 的最大值，dp[2][i] = max(dp[2][i], dp[1][j-1]+prices[i]-prices[j])
        * 第一种情况，表示未进行交易
        * 第二种情况，表示第 j 天买入第 i 天卖出的收益且加上第一层动态规划的第 j-1 天的最大收益（要求第二次交易必须在第一次交易之后）

In [57]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        n = len(prices)
        dp = [[0]*n for _ in range(3)]
        for k in range(1, 3):
            for i in range(1, n):
                # 第一层动态对话，初始化第二层动态规划
                dp[k][i] = max(dp[k][i-1], prices[i]-prices[0])  
                for j in range(1, i+1):
                    # 第二层动态规划
                    dp[k][i] = max(dp[k][i], dp[k-1][j-1]+prices[i]-prices[j])
        return dp[-1][-1]

In [58]:
test = Solution()
prices_li = [[3,3,5,0,0,3,1,4], [1,2,3,4,5]]
for prices in prices_li:
    print(test.maxProfit(prices))

6
4


### 优化上一种方案（超时）
* 先求 dp[k-1][j-1]-prices[j] 最大值, 再求 prices[i] 的最大值

（意义不大，但有助于下一个方案的理解）

In [61]:
class Solution:
    def maxProfit(self, prices):
        if not prices: return 0
        n = len(prices)
        dp = [[0] * n for _ in range(3)]
        for k in range(1, 3):
            for i in range(1, n):
                pre_max = -prices[0]
                for j in range(1, i + 1):
                    pre_max = max(pre_max, dp[k - 1][j - 1] - prices[j])
                dp[k][i] = max(dp[k][i - 1], prices[i] + pre_max)
        return dp[-1][-1]

In [62]:
test = Solution()
prices_li = [[3,3,5,0,0,3,1,4], [1,2,3,4,5]]
for prices in prices_li:
    print(test.maxProfit(prices))

6
4


### 致幻方案

#### 观察上一方案中的 i 循环和 j 循环：
* 本质上更新 dp[k][i]，而每次寻找 pre_max 最大值都是遍历区间 [1, i]，因此 j 循环与 i 循环是重叠的，可以同步更新 pre_max 和 dp[k][i]。

（该方案可通过所有测试样例，但不好理解（大佬除外））

In [87]:
class Solution:
    def maxProfit(self, prices):
        if not prices: return 0
        n = len(prices)
        dp = [[0] * n for _ in range(3)]
        for k in range(1, 3):
            pre_max = -prices[0]             
            for i in range(1, n):                                   
                pre_max = max(pre_max, dp[k - 1][i - 1] - prices[i])    
                dp[k][i] = max(dp[k][i - 1], prices[i] + pre_max)       
        return dp[-1][-1]

In [88]:
test = Solution()
prices_li = [[3,3,5,0,0,3,1,4], [1,2,3,4,5]]
for prices in prices_li:
    print(test.maxProfit(prices))

6
4


### 优化可读性方案

#### 最多一次交易的动态规划：
* dp[i] = max(dp[i-1], dp[i] - dp[j])，0<=j<=i
* 第 i 天的最大收益 = max（第 i-1 天的收益，第 j 天买入第 i 天卖出的收益）
    * 若为第一种情况，表示未进行交易
    * 若为第二种情况，表示进行交易且收益大于前一天的最大收益；dp[j] 为第 i 天之前的最低股票值。
    
#### 最多两次交易的动态规划：
* dp[t][i] = max(dp[t][i-1], prices[i]-min_p)
* 第 t 次交易第 i 天的最大收益 = max（第 t 次交易第 i-1 天的收益，第 i 天卖出的股票收益-第 i 天之前的最小负收益）
* 考虑最多一次交易的动态规划中 dp[j] 为第 i 天之前买入股票的最低值，即最小值，则 min_p 也为第 i 天之前的最小值，但要加入之前交易次数的影响。由于买入股票为负收益，而第 i-1 天的上次交易后的最大收益为 dp[t-1][i-1]，因此最小值 min(min_p, prices[i]-dp[t-1][i-1])。
* 由于 min_p 为第 i 天之前的最小值，则可通过一次遍历，同步计算 min_p 和 dp[t][i]。

In [89]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        n = len(prices)
        dp = [[0]*n for _ in range(3)]
        for t in range(1, 3):
            min_p = prices[0]              # 初始化最小负收益，即买入初始股票
            for i in range(1, n):
                min_p = min(min_p, prices[i]-dp[t-1][i-1])     # 更新最小负收益 
                dp[t][i] = max(dp[t][i-1], prices[i]-min_p)    # 更新当前交易次数下第 i 天的最大收益
        return dp[-1][-1]

In [90]:
test = Solution()
prices_li = [[3,3,5,0,0,3,1,4], [1,2,3,4,5]]
for prices in prices_li:
    print(test.maxProfit(prices))

6
4


这时候返回去再想致幻方案应该有好理解一些了

## 动态规划思路

In [None]:
for 状态1 in 状态1的所有取值：
    for 状态2 in 状态2的所有取值：
        for ...
            dp[状态1][状态2][...] = 择优(选择1，选择2...)

### 分析
#### 每天三种「选择」：
* 买入 buy
* 卖出 sell
* 无操作 rest

#### 情况：
* sell 在 buy 之后
* buy 在 sell 之后
* rest 操作
    * buy 之后 restrest（持有了股票）
    * sell 之后的 rest（没有持有股票）
* 交易次数 k 限制，即 buy 在 k > 0 的前提下操作

### 步骤1：穷举
#### 状态
* 天数
* 交易次数
* 持有状态（1 表示持有，0 表示未持有）
#### 则 `dp[i][k][0 or 1]`，`n` 为天数，`K` 为最多交易数，该问题有 `n × K × 2` 种状态

In [None]:
for 0 <= i < n:
    for 1 <= k <= K:
        for s in {0, 1}:
            dp[i][k][s] = max(buy, sell, rest)

#### 目的：求 `dp[n - 1][K][0]`

### 步骤2：状态转移图

![0123.图01](0123.图01.PNG)

#### 得状态转移方程：
`dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1] + prices[i])`

              `max(   选择 rest  ,           选择 sell     )`

`dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0] - prices[i])`

              `max(   选择 rest  ,           选择 buy        )`

buy 或 sell 之后交易次数 +1 

**注意**：边界

`dp[-1][k][0] = dp[i][0][0] = 0`
`dp[-1][k][1] = dp[i][0][1] = -infinity`

### 步骤3：化简

### 练习1：K=1

#### 121.买卖股票的最佳时机

#### 状态转移方程：
`dp[i][1][0] = max(dp[i-1][1][0], dp[i-1][1][1] + prices[i])`

`dp[i][1][1] = max(dp[i-1][1][1], dp[i-1][0][0] - prices[i]) = max(dp[i-1][1][1], -prices[i])`

#### 化简：
* k = 0 时，dp[i-1][0][0] = 0
* 消去 k = 0 的状态 --> 其余 k 都为 1 --> 消去 k

#### 得：
`dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])`

`dp[i][1] = max(dp[i-1][1], -prices[i])`

In [3]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        n = len(prices)
        # 初始化 i=0 的状态
        dp = [[0]*2 for _ in range(n)]
        dp[0][1] = -prices[0]
        # 从 i=1 处开始动态转移
        for i in range(1, n):
            dp[i][0] = max(dp[i-1][0], dp[i-1][1]+prices[i])
            dp[i][1] = max(dp[i-1][1], -prices[i])
        return dp[n-1][0]

In [4]:
test = Solution()
prices_li = [[7,1,5,3,6,4],
             [7,6,4,3,1],
             [1,2]
            ]
for prices in prices_li:
    print(test.maxProfit(prices))

5
0
1


### 优化：状态转移只与前一个状态有关

In [5]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        # 初始化状态
        dp_i_0 = 0
        dp_i_1 = -prices[0]
        # 从 i=1 处开始迭代
        for i in range(1, len(prices)):
            dp_i_0 = max(dp_i_0, dp_i_1+prices[i])
            dp_i_1 = max(dp_i_1, -prices[i])
        return dp_i_0

In [6]:
test = Solution()
prices_li = [[7,1,5,3,6,4],
             [7,6,4,3,1],
             [1,2]
            ]
for prices in prices_li:
    print(test.maxProfit(prices))

5
0
1


#### 注意：化简后，边界，可从第 `0` 步开始迭代，初始化 `dp_i_1` 为 负无穷大

In [7]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        # 初始化状态
        dp_i_0 = 0
        dp_i_1 = float('-inf')
        # 从 i=0 处开始迭代
        for i in range(len(prices)):
            dp_i_0 = max(dp_i_0, dp_i_1+prices[i])
            dp_i_1 = max(dp_i_1, -prices[i])
        return dp_i_0

In [8]:
test = Solution()
prices_li = [[7,1,5,3,6,4],
             [7,6,4,3,1],
             [1,2]
            ]
for prices in prices_li:
    print(test.maxProfit(prices))

5
0
1


### 练习2：K=正无穷

#### 122.买卖股票的最佳时机II

#### 状态转移方程：
`dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1] + prices[i])`

`dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0] - prices[i])`
#### 化简：K 不受限制，可消去 K
`dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])`

`dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i])`

In [188]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0 
        dp_i_0, dp_i_1 = 0, float('-inf') 
        for i in range(len(prices)):
            temp = dp_i_0
            dp_i_0 = max(dp_i_0, dp_i_1 + prices[i])
            dp_i_1 = max(dp_i_1, temp - prices[i])
        return dp_i_0

In [189]:
test = Solution()
prices_li = [[7,1,5,3,6,4],
             [1,2,3,4,5],
             [7,6,4,3,1]
            ]
for prices in prices_li:
    print(test.maxProfit(prices))

7
4
0


### 练习3：K=正无穷，卖出后要等一天之后才能继续交易

#### 309. 最佳买卖股票时机含冷冻期

#### 动态转移方程：
`dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])`

`dp[i][1] = max(dp[i-1][1], dp[i-2][0] - prices[i])`

**说明**：再次购买时需要隔一天。即状态转为 1 时（买股票时）需要前两天为未持有股票状态。

In [190]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        
        dp_i_0, dp_i_1 = 0, float('-inf')
        dp_pre_0 = 0
        for i in range(len(prices)):
            temp = dp_i_0
            dp_i_0 = max(dp_i_0, dp_i_1+prices[i])
            dp_i_1 = max(dp_i_1, dp_pre_0-prices[i])
            dp_pre_0 = temp
        return dp_i_0

In [191]:
test = Solution()
prices = [1,2,3,0,2]
test.maxProfit(prices)

3

### 练习4：K=正无穷，每次交易需要手续费（一次买入+一次卖出=一次交易）

#### 714. 买卖股票的最佳时机含手续费

#### 动态转移方程：
`dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])`

`dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i] - fee)`

**解释**：
* `dp[i][1]` 中 `-fee` 相当于买入的价格提高了
* `dp[i][0]` 中 `-fee` 相当于卖处的利润减小了（效果相同，但注意初始化处也相应减去手续费）

    `dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i] - fee)`
    
    `dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i])`

In [196]:
class Solution:
    def maxProfit(self, prices, fee):
        if not prices:
            return 0
        
        dp_i_0, dp_i_1 = 0, float('-inf')
        for i in range(len(prices)):
            dp_i_0 = max(dp_i_0, dp_i_1+prices[i])
            dp_i_1 = max(dp_i_1, dp_i_0-prices[i]-fee)
        return dp_i_0

In [197]:
prices = [1, 3, 2, 8, 4, 9]
fee = 2

test = Solution()
test.maxProfit(prices, fee)

8

### 练习5：K=2
#### 123.买卖股票的最佳时机III

#### 动态转移方程：
`dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1] + prices[i])`

`dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0] - prices[i])`

**注意**：穷举所有状态

**对比**：之前的练习都消去了 k，而该练习需要考虑交易次数 k 的影响。

In [9]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        n = len(prices)
        # 初始化状态
        dp = [[[0]*2 for _ in range(3)] for _ in range(n)]
        for i in range(3):
            dp[0][i][1] = -prices[0]
        # 从 i=1 处开始迭代
        for i in range(1, n):
            for k in range(1, 3):
                dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1]+prices[i])
                dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0]-prices[i])
        return dp[n-1][2][0]

In [10]:
test = Solution()
prices_li = [[3,3,5,0,0,3,1,4], [1,2,3,4,5]]
for prices in prices_li:
    print(test.maxProfit(prices))

6
4


#### 化简：由于该练习 K 值较小，因此可以手动列举 k=1 和 k=2 的情况，不用使用 for 循环。

In [78]:
class Solution:
    def maxProfit(self, prices):
        if not prices:
            return 0
        n = len(prices)
        # 初始化状态
        dp_i_1_0 = dp_i_2_0 = 0
        dp_i_1_1 = dp_i_2_1 = float('-inf') 
        # 等同于从 i=0 处开始迭代
        for i in range(n):
            dp_i_1_0 = max(dp_i_1_0, dp_i_1_1+prices[i])
            dp_i_1_1 = max(dp_i_1_1, -prices[i])
            
            dp_i_2_0 = max(dp_i_2_0, dp_i_2_1+prices[i])
            dp_i_2_1 = max(dp_i_2_1, dp_i_1_0-prices[i])
        return dp_i_2_0

In [79]:
test = Solution()
prices_li = [[3,3,5,0,0,3,1,4], [1,2,3,4,5]]
for prices in prices_li:
    print(test.maxProfit(prices))

6
4


### 练习6：K=给定值
**注意**：约束 k，有效交易次数小于等于 n//2

In [90]:
class Solution:
    def maxProfit(self, k, prices):
        if not prices:
            return 0
        n = len(prices)
        max_k = n//2        # 最大交易次数
        if k >= max_k:      # k>最大交易次数，做 k=无穷大处理
            res = 0
            for i in range(n-1):
                res += max(0, prices[i+1]-prices[i])
            return res
        else:
            max_k = k
        # k<最大交易次数，动态规划
        dp = [[[0]*2 for _ in range(k+1)] for _ in range(n)]
        for i in range(max_k+1):
            dp[0][i][1] = -prices[0]
        for i in range(1, n):
            for k in range(1, max_k+1):
                dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1]+prices[i])
                dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0]-prices[i])
        return dp[n-1][max_k][0]

In [91]:
test = Solution()
prices_li = [[2,4,1], [3,2,6,5,0,3]]
k_li = [2, 2]
for prices, k in zip(prices_li, k_li):
    print(test.maxProfit(k, prices))

2
7
