动态规划
动态规划(dynamic programming)是一种算法设计方法。基本思想是在对一个问题的多阶段决策中,按照某一顺序,根据每一步所选决策的不同,会引起状态的转移,最后会在变化的状态中获取到一个决策序列。
上面这段话是比较官方的术语描述,还可以这样从编程层面理解:动态规划一般用于求解具有重叠子问题和最优子结构特性的问题。它通过将大问题分解为小问题,并存储小问题的解(通常在一个表格中),避免了重复计算,从而提高了效率。动态规划可以应用于许多类型的问题,包括但不限于最优化问题、计数问题和决策问题。
最长公共子串
比较2个字符串,找出最长的公共子串,这就是最长公共子串问题(longest common substring, 简lcs)。
本文描述的最长子串问题,还有一个输出限制:若存在多个最长公共子串,输出在较短字符串中最先出现的那个lcs。这个限制简化了问题,让我们专注在寻找lcs的算法本源上。
动态规划思路:使用一个二维数组dp_cs记录字符串a和b比较的中间结果,其中dp_cs[i+1][j+1]表示a[0~i]与b[0~j]比较,以a[i]和b[j]结尾的最长子串的长度。如果a[i]==b[j],那么dp_cs[i+1][j+1] = dp[i][j] + 1,否则dp_cs[i+1][j+1] = 0。
代码如下:
char *dp_longest_common_substring(const char *a, const char *b) {
int len_a = strlen(a), len_b = strlen(b), maxLen = 0, endPos = 0;
int dp_cs[len_a + 1][len_b + 1];
memset(dp_cs, 0, sizeof(dp_cs)); // 默认都为0
for (int i = 0; i < len_a; i++) {
for (int j = 0; j < len_b; j++) {
if (a[i] == b[j]) {
dp_cs[i + 1][j + 1] = dp_cs[i][j] + 1;
if (dp_cs[i + 1][j + 1] > maxLen) {
maxLen = dp_cs[i + 1][j + 1]; // 记录最长的子串长度
endPos = len_a > len_b ? j : i; // 记录最长子串的位置(在最短字符串中的结束位置)
}
}
}
}
if (maxLen > 0) {
char *substr = (char *)malloc(maxLen + 1); // 注意返回的子串需要free掉,否则内存泄漏
strncpy(substr, len_a > len_b ? &b[endPos - maxLen + 1] : &a[endPos - maxLen + 1], maxLen);
substr[maxLen] = '\0';
return substr;
}
return NULL;
}
测试代码:
int test_lcs(int argc, char **argv) {
string str1s[] = {"123123", "123213", "3243522", "35qeaaaafu", "12aaaaiul"};
string str2s[] = {"123123", "123213", "3243522", "qeaaaaf", "aaaaiu"};
for (int i = 0; i < sizeof(str1s) / sizeof(str1s[0]); i++) {
char *lcs = dp_longest_common_substring(str1s[i].c_str(), str2s[i].c_str());
if (lcs == NULL) {
printf(">>>> case[%02d] has no lcs\n", i + 1);
continue;
}
printf(">>>> case[%02d] lcs: '%s'\n", i + 1, lcs);
free(lcs);
}
return 0;
}
测试输出: