力扣热门100题 - 10. 正则表达式匹配
- 题目描述:
- 示例:
- 提示:
- 解题思路(动态规划):
题目链接:10. 正则表达式匹配
题目描述:
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
示例:
输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。
输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
提示:
1 <= s.length <= 20
1 <= p.length <= 20
s 只包含从 a-z 的小写字母。
p 只包含从 a-z 的小写字母,以及字符 . 和 *。
保证每次出现字符 * 时,前面都匹配到有效的字符
解题思路(动态规划):
使用动态规划来解决正则表达式匹配的问题。下面是解题思路的简要说明:
- 动态规划数组定义:首先,定义一个二维布尔数组
dp[i][j]
,其中dp[i][j]
表示字符串s
的前i
个字符和正则表达式p
的前j
个字符是否匹配。 - 初始化:空字符串和空正则表达式是匹配的,因此
dp[0][0] = true
。 - 初始化第一行(s为空)
:遍历正则表达式
p,如果当前字符为
‘*’,则可以选择匹配零个前面的元素,即
dp[0][j] = dp[0][j - 2]`。 - 填充动态规划数组:通过遍历
s
和p
的字符来填充动态规划数组,根据当前字符是否匹配,更新dp[i][j]
的值。- 如果当前字符匹配,即
'.'
或者与当前字符相同,那么dp[i][j] = dp[i - 1][j - 1]
。 - 如果当前字符是
'*'
,需要处理匹配零个和匹配一个或多个的情况:- 匹配零个前面的元素:
dp[i][j] = dp[i][j - 2]
。 - 匹配一个或多个前面的元素:
dp[i][j] = dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.')
。
- 匹配零个前面的元素:
- 如果当前字符匹配,即
- 返回结果:最终结果为
dp[m][n]
,即整个字符串s
和正则表达式p
是否匹配。
时间复杂度: O(m * n)
这段代码的时间复杂度为 O(m * n),其中 m 是字符串 s 的长度,n 是正则表达式 p 的长度。
在填充动态规划数组时,我们需要遍历字符串 s 和正则表达式 p 的所有字符,所以填充动态规划数组的时间复杂度为 O(m * n)。因此,总体的时间复杂度为 O(m * n)。
代码:
public boolean isMatch(String s, String p) {
int m = s.length();
int n = p.length();
// 创建动态规划数组,dp[i][j] 表示 s 的前 i 个字符和 p 的前 j 个字符是否匹配
boolean[][] dp = new boolean[m + 1][n + 1];
// 初始化,空字符串和空正则表达式是匹配的
dp[0][0] = true;
// 处理正则表达式中的 '*',初始化第一行
for (int j = 1; j <= n; j++) {
if (p.charAt(j - 1) == '*') {
// '*' 匹配零个前面的元素
dp[0][j] = dp[0][j - 2];
}
}
// 填充动态规划数组
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
char sc = s.charAt(i - 1);
char pc = p.charAt(j - 1);
// 如果当前字符匹配,即 '.' 或者与当前字符相同
if (pc == '.' || pc == sc) {
dp[i][j] = dp[i - 1][j - 1];
} else if (pc == '*') {
/* 处理 '*' 的情况,分为匹配零个和匹配一个或多个
dp[i][j - 2]: 表示 '*' 匹配零个前面的元素,也就是忽略掉 '*' 和它前面的那个字符。
(dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.')):这部分表示 '*' 匹配一个或多个前面的元素。具体分解如下:
dp[i - 1][j]:检查 s 的前 i - 1 个字符和 p 的前 j 个字符是否匹配。
(s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.'):检查 s 的第 i 个字符和 p 的前 j - 2 个字符是否匹配。*/
dp[i][j] = dp[i][j - 2] || (dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.'));
}
}
}
// 最终结果为 dp[m][n]
return dp[m][n];
}