|
| 1 | +# 题目描述(困难难度) |
| 2 | + |
| 3 | + |
| 4 | + |
| 5 | +依旧是买卖股票的延伸,但比 [121 题](<https://leetcode.wang/leetcode-121-Best-Time-to-Buy-and-Sell-Stock.html>) , [122 题](<https://leetcode.wang/leetcode-122-Best-Time-to-Buy-and-Sell-StockII.html>) 难度高了不少。这道题的意思是,给一个数组代表股票每天的价格。你最多可以买入卖出两次,但只有卖出了才可以再次买入,求出最大的收益是多少。 |
| 6 | + |
| 7 | +# 解法一 |
| 8 | + |
| 9 | +参考 [这里](<https://leetcode.com/problems/best-time-to-buy-and-sell-stock-iii/discuss/135704/Detail-explanation-of-DP-solution>)。 |
| 10 | + |
| 11 | +开始的想法是求出收益第一高和第二高的两次买卖,然后加起来。对于普通的情况是可以解决的,但是对于下边的情况 |
| 12 | + |
| 13 | +```java |
| 14 | +1 5 2 8 3 10 |
| 15 | +``` |
| 16 | + |
| 17 | +第一天买第二天卖,第三天买第四天卖,第五天买第六天卖,三次收益分别是 `4`,`6`,`7`,最高的两次就是 `6 + 7 = 13` 了,但是我们第二天其实可以不卖出,第四天再卖出,那么收益是 `8 - 1 = 7`,再加上第五天买入第六天卖出的收益就是 `7 + 7 = 14`了。 |
| 18 | + |
| 19 | +所以当达到了一个高点时不一定要卖出,所以需要考虑的情况就很多了,不能像 [121 题](<https://leetcode.wang/leetcode-121-Best-Time-to-Buy-and-Sell-Stock.html>) , [122 题](<https://leetcode.wang/leetcode-122-Best-Time-to-Buy-and-Sell-StockII.html>) 那样简单的考虑了。那只能朝着动态规划思路想了。 |
| 20 | + |
| 21 | +动态规划关键就是数组定义和状态转移方程了。 |
| 22 | + |
| 23 | +按最简单的动态规划的思路想,用 `dp[i]`表示前`i`天的最高收益,那么 `dp[i+1]` 怎么根据 `dp[i]` 求出来呢?发现并不能求出来。 |
| 24 | + |
| 25 | +我们注意到我们题目是求那么多天最多交易两次的最高收益,还有一个**最多交易次数**的变量,我们把它加到数组中再试一试。 |
| 26 | + |
| 27 | +用 `dp[i][k]` 表示前`i`天最多交易`k`次的最高收益,那么 `dp[i][k]` 怎么通过之前的解求出来呢? |
| 28 | + |
| 29 | +首先第 `i` 天可以什么都不操作,今天的最高收益就等于昨天的最高收益 |
| 30 | + |
| 31 | +`dp[i][k] = dp[i-1][k]` |
| 32 | + |
| 33 | +此外,为了获得更大收益我们第 `i` 天也可以选择卖出,既然选择卖出,那么在`0`到 `i-1` 天就要选择一天买入。多选择了一次买入,那在买入之前已经进行了 `k-1` 次买卖。 |
| 34 | + |
| 35 | +在第 `0` 天买入,收益就是 ` prices[i] - prices[0] ` |
| 36 | + |
| 37 | +在第 `1` 天买入,收益就是 `prices[i] - prices[1] + dp[0][k-1]`,多加了前一天的最大收益 |
| 38 | + |
| 39 | +在第 `2` 天买入,收益就是 `prices[i] - prices[2] + dp[1][k-1]`,多加了前一天的最大收益 |
| 40 | + |
| 41 | +... |
| 42 | + |
| 43 | +在第 `j` 天买入,收益就是 `prices[i] - prices[j] + dp[j-1][k-1]`,多加了前一天的最大收益 |
| 44 | + |
| 45 | +上边的每一种可能选择一个最大的,然后与第`i`天什么都不操作比较,就是`dp[i][k]`的值了。 |
| 46 | + |
| 47 | +当然上边的推导已经可以写代码了,但为了最后的代码更加简洁(写完代码后发现的),我们可以再换一下状态转移方程。真的只是为了简洁,时间复杂度和空间复杂度上不会有影响。 |
| 48 | + |
| 49 | +> 为了获得更大收益我们第 `i` 天也可以选择卖出,既然选择卖出,那么在`0`到 `i-1` 天就要选择一天买入。 |
| 50 | +
|
| 51 | +我们也可以选择`0`到`i`天中选择一天买入,因为第 `i` 天买入,第 `i`天卖出对最后的收益是没有影响的。 |
| 52 | + |
| 53 | +>在第 `j` 天买入,收益就是 `prices[i] - prices[j] + dp[j-1][k-1]`,多加了前一天的最大收益 |
| 54 | +
|
| 55 | +我们多加了前一天的最大收益,我们也可以改成加当前天的最大收益。 |
| 56 | + |
| 57 | +在第 `j` 天买入,收益就是 `prices[i] - prices[j] + dp[j][k-1]` |
| 58 | + |
| 59 | +不严谨的想一下,如果第 `j` 天就是最后我们要选择的买入点,它使得最后的收益最高,`dp[j][k-1]` 和 `dp[j-1][k-1]` 一定是相等的。因为第 `j` 天一定是一个低点而第 `j - 1` 天是个高点,第 `j` 天为了得到更高收益肯定选择不操作,所以和第 `j - 1` 天的收益是一样的,所以改了状态转移方程,最后求出的最高解还是一致的。 |
| 60 | + |
| 61 | +综上,最后的状态转移方程就是 |
| 62 | + |
| 63 | +`dp[i][k] = Max(dp[i-1][k],(prices[i] - prices[0] + dp[0][k-1]),(prices[i] - prices[1] + dp[1][k-1])...(prices[i] - prices[i] + dp[i][k-1]))` |
| 64 | + |
| 65 | +也就是 |
| 66 | + |
| 67 | +`dp[i][k] = Max(dp[i-1][k],prices[i] - prices[j] + dp[j][k-1])`,`j` 取 `0 - i`。 |
| 68 | + |
| 69 | +而 `prices[i] - prices[j] + dp[j][k-1]` 也可以看做, `prices[i] - (prices[j] - dp[j][k-1])` ,为了求这个表达式的最大值,我们可以找`prices[j] - dp[j][k-1]`的最小值。 |
| 70 | + |
| 71 | +而初始条件对于`k` 等于 `0` 的情况,收益就是 `0` 了。 |
| 72 | + |
| 73 | +还有前 `0` 天的最大收益也是 0 ,也就是`dp[0][k]`是 0 。由于下标是从`0`开始的,这里的前`0`天其实就是第一天。 |
| 74 | + |
| 75 | +因为初始条件的结果都是`0`,数组初始化后就是 `0` ,所以不需要特殊处理。 |
| 76 | + |
| 77 | +```java |
| 78 | +public int maxProfit(int[] prices) { |
| 79 | + if (prices.length == 0) { |
| 80 | + return 0; |
| 81 | + } |
| 82 | + int K = 2; |
| 83 | + int[][] dp = new int[prices.length][K + 1]; |
| 84 | + for (int k = 1; k <= K; k++) { |
| 85 | + for (int i = 1; i < prices.length; i++) { |
| 86 | + int min = Integer.MAX_VALUE; |
| 87 | + //找出第 0 天到第 i 天 prices[buy] - dp[buy][k - 1] 的最小值 |
| 88 | + for (int buy = 0; buy <= i; buy++) { |
| 89 | + min = Math.min(prices[buy] - dp[buy][k - 1], min); |
| 90 | + } |
| 91 | + //比较不操作和选择一天买入的哪个值更大 |
| 92 | + dp[i][k] = Math.max(dp[i - 1][k], prices[i] - min); |
| 93 | + } |
| 94 | + } |
| 95 | + return dp[prices.length - 1][K]; |
| 96 | +} |
| 97 | +``` |
| 98 | + |
| 99 | +找第 `j` 天`prices[buy] - dp[buy][k - 1] `的最小值的时候,我们考虑了 `prices[0] - dp[0][k - 1] `、 `prices[1] - dp[1][k - 1] `、 `prices[2] - dp[2][k - 1] `...,找第 `j + 1` 天`prices[buy] - dp[buy][k - 1] `的最小值的时候,我们又会从头考虑 `prices[0] - dp[0][k - 1] `、 `prices[1] - dp[1][k - 1] `、 `prices[2] - dp[2][k - 1] `...,所以其实没必要每次从头考虑,我们只需要把之前的结果保存起来,然后再和新加入的 `prices[j+1] - dp[j+1][k - 1] ` 比较就可以了。 |
| 100 | + |
| 101 | +```java |
| 102 | +public int maxProfit(int[] prices) { |
| 103 | + if (prices.length == 0) { |
| 104 | + return 0; |
| 105 | + } |
| 106 | + int K = 2; |
| 107 | + int[][] dp = new int[prices.length][K + 1]; |
| 108 | + for (int k = 1; k <= K; k++) { |
| 109 | + int min = prices[0]; |
| 110 | + for (int i = 1; i < prices.length; i++) { |
| 111 | + //找出第 1 天到第 i 天 prices[buy] - dp[buy][k - 1] 的最小值 |
| 112 | + min = Math.min(prices[i] - dp[i][k - 1], min); |
| 113 | + //比较不操作和选择一天买入的哪个值更大 |
| 114 | + dp[i][k] = Math.max(dp[i - 1][k], prices[i] - min); |
| 115 | + } |
| 116 | + } |
| 117 | + return dp[prices.length - 1][K]; |
| 118 | +} |
| 119 | +``` |
| 120 | + |
| 121 | +此时按照动态规划的套路,结合代码和下边的图。 |
| 122 | + |
| 123 | + |
| 124 | + |
| 125 | +根据代码,我们是固定 `k` 然后一列一列更新 `dp`。而更新当前列只需要前一列的信息,所以不需要二维数组,只需要一个一维数组。但是注意到最外层的 `for` 循环是一个常数次,所以我们可以把两层循环内外颠倒下,可以更好的进行空间复杂度的优化。 |
| 126 | + |
| 127 | +```java |
| 128 | +public int maxProfit(int[] prices) { |
| 129 | + if (prices.length == 0) { |
| 130 | + return 0; |
| 131 | + } |
| 132 | + int K = 2; |
| 133 | + int[][] dp = new int[prices.length][K + 1]; |
| 134 | + int min[] = new int[K + 1]; |
| 135 | + for (int i = 1; i <= K; i++) { |
| 136 | + min[i] = prices[0]; |
| 137 | + } |
| 138 | + for (int i = 1; i < prices.length; i++) { |
| 139 | + for (int k = 1; k <= K; k++) { |
| 140 | + min[k] = Math.min(prices[i] - dp[i][k - 1], min[k]); |
| 141 | + dp[i][k] = Math.max(dp[i - 1][k], prices[i] - min[k]); |
| 142 | + } |
| 143 | + } |
| 144 | + return dp[prices.length - 1][K]; |
| 145 | +} |
| 146 | + |
| 147 | +``` |
| 148 | + |
| 149 | + |
| 150 | + |
| 151 | +再结合图看,此时我们就是一行一行的更新了,对于每一列都有一个 `min` 所以我们多了 `min` 数组。现在让我们将二维数组 `dp` 改成一维数组。 |
| 152 | + |
| 153 | +```java |
| 154 | +public int maxProfit(int[] prices) { |
| 155 | + if (prices.length == 0) { |
| 156 | + return 0; |
| 157 | + } |
| 158 | + int K = 2; |
| 159 | + int[] dp = new int[K + 1]; |
| 160 | + int min[] = new int[K + 1]; |
| 161 | + for (int i = 1; i <= K; i++) { |
| 162 | + min[i] = prices[0]; |
| 163 | + } |
| 164 | + for (int i = 1; i < prices.length; i++) { |
| 165 | + for (int k = 1; k <= K; k++) { |
| 166 | + min[k] = Math.min(prices[i] - dp[k - 1], min[k]); |
| 167 | + dp[k] = Math.max(dp[k], prices[i] - min[k]); |
| 168 | + } |
| 169 | + } |
| 170 | + return dp[K]; |
| 171 | +} |
| 172 | +``` |
| 173 | + |
| 174 | +由于 `K` 是一个常数,所以我们的 `min` 数组和 `dp` 数组都可以分别当成两个变量。 |
| 175 | + |
| 176 | +```java |
| 177 | +public int maxProfit(int[] prices) { |
| 178 | + if (prices.length == 0) { |
| 179 | + return 0; |
| 180 | + } |
| 181 | + int dp1 = 0; |
| 182 | + int dp2 = 0; |
| 183 | + int min1 = prices[0]; |
| 184 | + int min2 = prices[0]; |
| 185 | + for (int i = 1; i < prices.length; i++) { |
| 186 | + min1 = Math.min(prices[i] - 0, min1); |
| 187 | + dp1 = Math.max(dp1, prices[i] - min1); |
| 188 | + |
| 189 | + min2 = Math.min(prices[i] - dp1, min2); |
| 190 | + dp2 = Math.max(dp2, prices[i] - min2); |
| 191 | + } |
| 192 | + return dp2; |
| 193 | +} |
| 194 | +``` |
| 195 | + |
| 196 | +如果结合一步一步的优化,最后这个代码也就很好的能解释通了。 |
| 197 | + |
| 198 | +# 解法二 |
| 199 | + |
| 200 | +再分享个利用状态机的 [解法](<https://leetcode.com/problems/best-time-to-buy-and-sell-stock-iii/discuss/149383/Easy-DP-solution-using-state-machine-O(n)-time-complexity-O(1)-space-complexity>),虽然不容易想到,但真的太强了,上次用状态机还是 [65 题](<https://leetcode.wang/leetCode-65-Valid-Number.html?h=%E7%8A%B6%E6%80%81>)。 |
| 201 | + |
| 202 | +每天我们其实是有四个状态,买入当前价格的股票,以当前价格的股票卖出。第二次买入股票,第二次卖出股票。 |
| 203 | + |
| 204 | + |
| 205 | + |
| 206 | +`s0`代表初始状态,初始时钱是 `0`。`s1`代表第一次买入后当前的钱,`s2`代表第一次卖出后当前的前,`s3`代表第二次买入后当前的钱,`s4`代表第二次卖出后当前的钱。 |
| 207 | + |
| 208 | +然后我们只需要更新每天的这四个状态即可。 |
| 209 | + |
| 210 | +```java |
| 211 | +int maxProfit(vector<int>& prices) { |
| 212 | + if(prices.empty()) return 0; |
| 213 | + //进行初始化,第一天 s1 将股票买入,其他状态全部初始化为最小值 |
| 214 | + int s1=-prices[0],s2=INT_MIN,s3=INT_MIN,s4=INT_MIN; |
| 215 | + |
| 216 | + for(int i=1;i<prices.size();++i) { |
| 217 | + s1 = max(s1, -prices[i]); //买入价格更低的股 |
| 218 | + s2 = max(s2, s1+prices[i]); //卖出当前股,或者不操作 |
| 219 | + s3 = max(s3, s2-prices[i]); //第二次买入,或者不操作 |
| 220 | + s4 = max(s4, s3+prices[i]); //第二次卖出,或者不操作 |
| 221 | + } |
| 222 | + return max(0,s4); |
| 223 | +} |
| 224 | +``` |
| 225 | + |
| 226 | +# 总 |
| 227 | + |
| 228 | +解法一比较常规,但是这个动态规划难在了我们考虑了两个变量,相比于之前的动态规划不容易想到。 |
0 commit comments