121. 买卖股票的最佳时机
题目链接:121. 买卖股票的最佳时机
思路:动态规划五步曲
-
dp
[
i][
0]
表示第i天持有股票所得最多现金,dp[
i][
1]
表示第i天不持有股票所得最多现金。一开始现金是0,那么加入第i天买入股票,现金就是 -prices[i], 这是一个负数。
注意这里说的是“持有”,“持有”不代表就是当天“买入”!也有可能是昨天就买入了,今天保持持有的状态
-
递推公式:
如果第i天持有股票即dp
[
i][
0]
, 那么可以由两个状态推出来第i-1天就持有股票,那么就保持现状,所得现金就是昨天持有股票的所得现金 即:dp
[
i - 1][
0]
第i天买入股票,所得现金就是买入今天的股票后所得现金即:-prices[i]
那么dp
[
i][
0]
应该选所得现金最大的,dp
[
i][
0]
= max(dp[
i - 1][
0]
, -prices[i])如果第i天不持有股票即dp
[
i][
1]
, 也可以由两个状态推出来第i-1天就不持有股票,那么就保持现状,所得现金就是昨天不持有股票的所得现金 即:dp
[
i - 1][
1]
第i天卖出股票,所得现金就是按照今天股票价格卖出后所得现金 即:dp
[
i - 1][
0]
+ prices[i]同样dp
[
i][
1]
取最大的,dp
[
i][
1]
= max(dp[
i - 1][
1]
, dp[
i - 1][
0]
+ prices[i]) -
初始化:
由递推公式可以看出其基础都是要从dp
[
0][
0]
和dp[
0][
1]
推导出来。那么dp
[
0][
0]
表示第0天持有股票,此时的持有股票就一定是买入股票了,因为不可能由前一天推出来,所以dp[
0][
0]
= -prices[0]dp
[
0][
1]
表示第0天不持有股票,不持有股票即现金就是0,所以dp[
0][
1]
= 0 -
遍历顺序:由递推公式可以看出,需要从前向后遍历。
-
举例推导dp数组
以输入:[7,1,5,3,6,4]为例,dp数组状态如下:
dp
[
5][
1]
就是最终结果。为什么不是dp[
5][
0]
呢?因为本题中不持有股票状态所得金钱一定比持有股票状态得到的多!
class Solution {
public int maxProfit(int[] prices) {
int len = prices.length;
// dp[i][0]代表第i天持有股票的最大收益
// dp[i][1]代表第i天不持有股票的最大收益
int[][] dp = new int[len][2];
// 初始化
dp[0][0] = -prices[0];
dp[0][1] = 0;
for (int i = 1; i < len; i++) {
dp[i][0] = Math.max(dp[i - 1][0], -prices[i]);
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] + prices[i]);
}
return dp[len - 1][1];
}
}
122. 买卖股票的最佳时机 II
题目链接:122. 买卖股票的最佳时机 II
思路:本题和121. 买卖股票的最佳时机的唯一区别是本题股票可以买卖多次了(注意任何时候 最多 只能持有 一股 股票,所以再次购买前要出售掉之前的股票)
在动规五步曲中,这个区别主要是体现在递推公式上,其他都和上一题相同。
dp数组的含义:
- dp
[
i][
0]
表示第i天持有股票所得现金 - dp
[
i][
1]
表示第i天不持有股票所得最多现金
如果第i天持有股票即dp[
i][
0]
, 那么可以由两个状态推出来
- 第i-1天就持有股票,那么就保持现状,所得现金就是昨天持有股票的所得现金 即:dp
[
i - 1][
0]
- 第i天买入股票,所得现金就是昨天不持有股票的所得现金减去今天的股票价格 即:dp
[
i - 1][
1]
- prices[i]
在121. 买卖股票的最佳时机中,因为股票全程只能买卖一次,所以如果买入股票,那么第i天持有股票即dp
[
i][
0]
一定就是 -prices[i]。而本题,因为一只股票可以买卖多次,所以当第i天买入股票的时候,所持有的现金可能有之前买卖过的利润。
再来看看如果第i天不持有股票即dp[
i][
1]
的情况, 依然可以由两个状态推出来
- 第i-1天就不持有股票,那么就保持现状,所得现金就是昨天不持有股票的所得现金 即:dp
[
i - 1][
1]
- 第i天卖出股票,所得现金就是按照今天股票价格卖出后所得现金即:dp
[
i - 1][
0]
+ prices[i]
注意这里与上一题是一样的逻辑,卖出股票收获利润(可能是负值)天经地义!
class Solution {
public int maxProfit(int[] prices) {
int len = prices.length;
// dp[i][0]代表第i天持有股票的最大收益
// dp[i][1]代表第i天不持有股票的最大收益
int[][] dp = new int[len][2];
// 初始化
dp[0][0] = -prices[0];
dp[0][1] = 0;
for (int i = 1; i < len; i++) {
// 注意这里是和121. 买卖股票的最佳时机唯一不同的地方。
dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] - prices[i]);
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] + prices[i]);
}
return dp[len - 1][1];
}
}
123. 买卖股票的最佳时机 III
题目链接:123. 买卖股票的最佳时机 III
思路:这道题目相对前两题难了不少。关键在于至多买卖两次,这意味着可以买卖一次,可以买卖两次,也可以不买卖。
动态规划五步曲:
-
确定dp数组以及下标的含义
一天有五个状态
-
没有操作 (其实也可以不设置这个状态)
-
第一次持有股票
-
第一次不持有股票
-
第二次持有股票
-
第二次不持有股票
dp
[
i][
j]
中 i表示第i天,j为 [0 - 4] 五个状态,dp[
i][
j]
表示第i天状态j所剩最大现金。需要注意:dp
[
i][
1]
,表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,这是容易陷入的误区。例如 dp
[
i][
1]
,并不是说第i天一定买入股票,有可能第i-1天就买入了,那么 dp[
i][
1]
延续买入股票的这个状态。 -
-
确定递推公式
达到dp
[
i][
1]
状态,有两个具体操作:操作一:第i天买入股票了,那么dp
[
i][
1]
= dp[
i - 1][
0]
- prices[i]操作二:第i天没有操作,沿用前一天买入的状态,即:dp
[
i][
1]
= dp[
i - 1][
1]
那么dp
[
i][
1]
究竟选 dp[
i - 1][
0]
- prices[i],还是dp[
i - 1][
1]
呢?一定是选最大的,dp
[
i][
1]
= max(dp[
i - 1][
1]
, dp[
i - 1][
0]
- prices[i])同理dp
[
i][
2]
也有两个操作:操作一:第i天卖出股票了,那么dp
[
i][
2]
= dp[
i - 1][
1]
+ prices[i]操作二:第i天没有操作,沿用前一天卖出的状态,即:dp
[
i][
2]
= dp[
i - 1][
2]
所以dp
[
i][
2]
= max(dp[
i - 1][
2]
, dp[
i - 1][
1]
+ prices[i])同理可推出剩下状态部分:
dp
[
i][
3]
= max(dp[
i - 1][
3]
, dp[
i - 1][
2]
- prices[i])dp
[
i][
4]
= max(dp[
i - 1][
4]
, dp[
i - 1][
3]
+ prices[i]) -
dp数组初始化
第0天没有操作,这个最容易想到,就是0,即:dp
[
0][
0]
= 0第0天做第一次买入的操作,dp
[
0][
1]
= -prices[0]第0天做第一次卖出的操作,这个初始值应该是多少呢?
此时还没有买入,怎么就卖出呢?
其实可以理解当天买入,当天卖出,所以dp
[
0][
2]
= 0第0天第二次买入操作,初始值应该是多少呢?
第一次还没买入呢,怎么初始化第二次买入呢?
第二次买入依赖于第一次卖出的状态,其实相当于第0天第一次买入了,第一次卖出了,然后再买入一次(第二次买入),那么现在手头上没有现金,只要买入,现金就相应减少。所以第二次买入操作,初始化为:dp
[
0][
3]
= -prices[0]同理第二次卖出初始化dp
[
0][
4]
= 0 -
确定遍历顺序
由递推公式可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
-
举例推导dp数组
以输入[1,2,3,4,5]为例
大家可以看到红色框为最后两次卖出的状态。
现在最大的时候一定是卖出的状态,而两次卖出的状态现金最大的一定是最后一次卖出。
也可以这么理解:如果第一次卖出已经是最大值了,那么可以在当天立刻买入再立刻卖出。所以dp
[
4][
4]
已经包含了dp[
4][
2]
的情况。也就是说第二次卖出手里所剩的钱一定是最多的。所以最终最大利润是dp[
4][
4]
。
class Solution {
public int maxProfit(int[] prices) {
int len = prices.length;
/*
* 定义 5 种状态:
* 0: 没有操作, 1: 第一次买入, 2: 第一次卖出,
* 3: 第二次买入, 4: 第二次卖出
*/
int[][] dp = new int[len][5];
// 初始化
dp[0][1] = -prices[0];
dp[0][3] = -prices[0];
for (int i = 1; i < len; i++) {
dp[i][0] = dp[i - 1][0];
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
dp[i][2] = Math.max(dp[i - 1][2], dp[i - 1][1] + prices[i]);
dp[i][3] = Math.max(dp[i - 1][3], dp[i - 1][2] - prices[i]);
dp[i][4] = Math.max(dp[i - 1][4], dp[i - 1][3] + prices[i]);
}
return dp[len - 1][4];
}
}
188. 买卖股票的最佳时机 IV
题目链接:188. 买卖股票的最佳时机 IV
思路:本题是上一题的进阶版,这里要求至多有k次交易。
动态规划五步曲:
-
确定dp数组以及下标的含义
使用二维数组 dp
[
i][
j]
:第i天的状态为j,所剩下的最大现金是dp[
i][
j]
j的状态表示为:
- 0 表示不操作
- 1 第一次买入
- 2 第一次卖出
- 3 第二次买入
- 4 第二次卖出
- …
可以发现规律 ,除了0以外,奇数就是买入,偶数就是卖出。
题目要求是至多有K笔交易,那么j的范围定义为 2 * k + 1 就可以了。
-
确定递推公式
需要强调一下:dp
[
i][
1]
,表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,这是容易陷入的误区。达到dp
[
i][
1]
状态,有两个具体操作:操作一:第i天买入股票了,那么dp
[
i][
1]
= dp[
i - 1][
0]
- prices[i]操作二:第i天没有操作,沿用前一天买入的状态,即:dp
[
i][
1]
= dp[
i - 1][
1]
选最大的,所以 dp
[
i][
1]
= max(dp[
i - 1][
1]
, dp[
i - 1][
0]
- prices[i])同理dp
[
i][
2]
也有两个操作:操作一:第i天卖出股票了,那么dp
[
i][
2]
= dp[
i - 1][
1]
+ prices[i]操作二:第i天没有操作,沿用前一天卖出的状态,即:dp
[
i][
2]
= dp[
i - 1][
2]
所以dp
[
i][
2]
= max(dp[
i - 1][
2]
, dp[
i - 1][
1]
+ prices[i])同理可以类比剩下的状态,代码如下:
for (int i = 1; i < prices.size(); i++) { for (int j = 0; j < 2 * k - 1; j += 2) { dp[i][j + 1] = Math.max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]); dp[i][j + 2] = Math.max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]); } }
本题与上一题最大的区别就是这里要类比j为奇数是买,偶数是卖的状态。
-
dp数组初始化
第0天没有操作,这个最容易想到,就是0,即:dp
[
0][
0]
= 0第0天做第一次买入的操作,dp
[
0][
1]
= -prices[0]第0天做第一次卖出的操作,这个初始值应该是多少呢?
此时还没有买入,怎么就卖出呢?
其实可以理解当天买入,当天卖出,所以dp
[
0][
2]
= 0第0天第二次买入操作,初始值应该是多少呢?
第一次还没买入呢,怎么初始化第二次买入呢?
第二次买入依赖于第一次卖出的状态,其实相当于第0天第一次买入了,第一次卖出了,然后再买入一次(第二次买入),那么现在手头上没有现金,只要买入,现金就相应减少。所以第二次买入操作,初始化为:dp
[
0][
3]
= -prices[0]同理第二次卖出初始化dp
[
0][
4]
= 0可以推出dp
[
0][
j]
当j为奇数的时候都初始化为 -prices[0]代码如下:
for (int j = 1; j < 2 * k; j += 2) { dp[0][j] = -prices[0]; }
在初始化的地方同样要类比j为奇数是买,偶数是卖的状态。
-
确定遍历顺序
由递推公式可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
-
举例推导dp数组
以输入[1,2,3,4,5],k=2为例。
最后一次卖出,一定是利润最大的,dp
[
len - 1][
2 * k]
即红色部分就是最终结果。
class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
if (len == 0) return 0;
// 至多有K笔交易,那么j的范围定义为 2 * k + 1
int[][] dp = new int[len][2 * k + 1];
// 初始化
for (int j = 1; j < 2 * k; j += 2) {
// dp[0][j]当j为奇数的时候都初始化为 -prices[0]
dp[0][j] = -prices[0];
}
for (int i = 1; i < len; i++) {
for (int j = 0; j < 2 * k - 1; j += 2) {
dp[i][j + 1] = Math.max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]);
dp[i][j + 2] = Math.max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]);
}
}
return dp[len - 1][2 * k];
}
}
也可以使用三维dp数组来解题
class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
if (len == 0) return 0;
// [天数][交易次数][是否持有股票]
int[][][] dp = new int[len][k + 1][2];
// dp数组初始化
for (int i = 0; i <= k; i++) {
dp[0][i][1] = -prices[0];
}
for (int i = 1; i < len; i++) {
for (int j = 1; j <= k; j++) {
// dp方程, 0表示不持有/卖出, 1表示持有/买入
dp[i][j][0] = Math.max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i]);
dp[i][j][1] = Math.max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i]);
}
}
return dp[len - 1][k][0];
}
}