467. 环绕字符串中唯一的子字符串https://leetcode.cn/problems/unique-substrings-in-wraparound-string/description/
定义字符串base为一个"abcdefghijklmnopqrstuvwxyz"无限环绕的字符串,所以base看起来是这样的:"...zabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcd...."。给你一个字符串s,请你统计并返回s中有多少不同非空子串也在base中出现。
- 输入:s = "a",输出:1,解释:字符串s的子字符串"a"在base中出现。
- 输入:s = "cac",输出:2,解释:字符串s有两个子字符串("a", "c")在base中出现。
- 输入:s = "zab",输出:6,解释:字符串s有六个子字符串("z", "a", "b", "za", "ab", and "zab")在base中出现。
提示:1 <= s.length <= 10^5,s由小写英文字母组成。
我们用动态规划的思想来解决这个问题。
确定状态表示:根据经验和题目要求,我们用dp[i]表示:以i位置为结尾的所有子串中,有几个在base中出现。
推导状态转移方程:由于题目描述中说明,s由小写英文字母组成,所以以i位置为结尾的子串,如果长度是1,那么一定在base中出现。如果以i位置为结尾的子串的长度大于1,那么一定是以i - 1位置为结尾的子串拼接上s[i]。如果s[i] == s[i - 1] + 1,或者s[i - 1] == 'z' && s[i] == 'a',那么以i - 1位置为结尾的所有在base中出现的子串,在后面拼接上s[i]后,一定也在base中出现,这样的子串有dp[i - 1]个。
初始化:根据状态转移方程,注意到当i = 0时,判断s[i] == s[i - 1] + 1时会越界。所以需要初始化dp[0]的值,根据状态表示,显然dp[0] = 1。当然,我们可以把dp表的所有值都初始化为1,计算dp[i](i > 0)时,如果s[i] == s[i - 1] + 1,或者s[i - 1] == 'z' && s[i] == 'a',那么dp[i] += dp[i - 1]。
填表顺序:根据状态转移方程,显然应从左往右填表。
返回值:根据状态表示,我们不能简单地返回dp表所有值的和,因为有些情况是重复的。我们需要考虑如何去重。注意到,相同字符结尾的dp值,我们只需要保留最大的,因为其余dp值对应的子串都可以在最大的dp值对应的子串中找到。比如,2个子串的结尾都是'c',其中一个dp值是3,那么出现在base中的子串就是("c", "bc", "abc"),另一个dp值是5,那么出现在base中的子串就是("c", "bc", "abc", "zabc", "yzabc"),显然后者包含前者。如何做到这一点呢?我们只需要定义一个哈希表,把每个字符对应的最大dp值存储到对应的位置即可。
细节问题:dp表的规模和s相同,均为1 x n。
class Solution {
public:
int findSubstringInWraproundString(string s) {
int n = s.size();
// 创建dp表
vector<int> dp(n, 1);
// 填表
for (int i = 1; i < n; i++) {
if (s[i] == s[i - 1] + 1 || (s[i - 1] == 'z' && s[i] == 'a')) {
dp[i] += dp[i - 1];
}
}
// 相同字符结尾的dp值,只保留最大的
vector<int> hash(26);
for (int i = 0; i < n; i++) {
hash[s[i] - 'a'] = max(hash[s[i] - 'a'], dp[i]);
}
return accumulate(hash.begin(), hash.end(), 0);
}
};