java数据结构与算法刷题目录(剑指Offer、LeetCode、ACM)-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/123063846 |
---|
正则表达式基础:https://blog.csdn.net/grd_java/article/details/136120841 |
---|
文章目录
- 一、简单的应用实例
- 1. 验证输入的是否是汉字
- 2. 数字相关
- 3. 验证复杂的URL
- 二、反向引用案例
- 三、结巴去重案例
- 四、算法题
一、简单的应用实例
1. 验证输入的是否是汉字
- 百度,或者问人工智能ChatGPT等,查询unicode对应的汉字编码,我们查到是16进制的4e00 - 9fa5. 对应到正则表达式就是\u4e00-\u9fa5
- 我们对一个字符串进行匹配,必须满足汉字开头,汉字结尾,也就是全部都得是汉字,所以需要用到正则定位符
^
和$
来定位开头和结尾。匹配所有汉字1个或多个,使用[\u4e00-\u9fa5]+
- 此时如果我们匹配的字符串并不全由汉字组成,就会返回false
2. 数字相关
6位数,第一个数不能为0,其余5个数随便。例如123890 |
---|
public static void main(String[] args) {
String content = "125806";
Pattern pattern = Pattern.compile("^[1-9]\\d{5}$");
Matcher matcher = pattern.matcher(content);
if(matcher.find()) System.out.println("匹配成功");
else System.out.println("匹配失败");
}
qq号码:1-9开头,剩余数字随便的5-10位数,例如12389,914401258 |
---|
- 关键在于使用{num1,num2}来限定数量,因为一共5-10个数,开头确定不能为0,剩余4-9个就可以用
\\d{4,9}
来作为匹配规则
手机号码:以13、14、15、18开头的11位数,例如13722095854 |
---|
3. 验证复杂的URL
下面的案例并不严谨,只是练习,如果想要正在利用正则表达式解决相关问题,做字符串相关的算法题会达到专项提升的效果。类似于数据库中sql语句的运用,就是不断解决问题,提高自己的处理问题的能力。
随便找一个URL为例:https://www.bilibili.com/video/BV1j4411W7F7/?spm_id_from=333.337.search-card.all.click&vd_source=f0637064fb8570e4bb79c51a3c016b30
- 第一部分:https://或者http://。正则表达式非常简单:
(?<one>http(?:s|))://
,首先是命名捕获分组,名称为one,限定匹配https或者http。后面跟:// - 第二部分:域名,前面的部分可能由若干个:
数字、字母、下划线、横线+一个点
组成。最后会跟.cn或.com等等。(?<two>(?:[\\w-]+\\.)+[\\w-]+)
命名捕获为two,\\w
表示任意字母数字或下划线,[\\w-]
表示从\\w
或者-
选一个。后面跟+,表示匹配若干个,然后\\.
表示匹配点。然后将这部分整体用+修饰,表示匹配若干个。最后通过[\\w-]+
匹配最后的.cn等内容
- 第3部分:后面的路径和文件名。主要由/分隔,并且由数字、字母、下划线、-、?、=、&、/、%、.、组成。当然第3部分是可有可无的,例如www.baidu.com就没有第三部分。所以用?修饰,表示0个或1个第三部分。正则表达式为
(?<three>(?:\/[\w-?=&/%.]*))?$
各位可能有些许疑问,[.]
中的点,为什么不加转义符号,因为点是特殊字符,如果我们想要原样匹配,需要加转义符号[\\.]
的形式。这是因为,类似(?:pattern)和[pattern]这种,都可以不需要转义符,而直接原样匹配特殊字符
public static void main(String[] args) {
String content = "https://www.bilibili.com/video/BV1j4411W7F7/?spm_id_from=333.337.search-card.all.click&vd_source=f0637064fb8570e4bb79c51a3c016b30";
Pattern pattern = Pattern.compile(
"(?<one>http(?:s|))://"+
"(?<two>(?:[\\w-]+\\.)+[\\w-]+)"+
"(?<three>(?:\\/[\\w-?=&/%.]*))?$"
);
Matcher matcher = pattern.matcher(content);
while(matcher.find()){
System.out.println("匹配到的URL:"+matcher.group(0));
System.out.println("http协议为:"+matcher.group("one"));
System.out.println("主机资源地址(ip+端口号或者域名):"+matcher.group("two"));
System.out.println("路径和文件位置:"+matcher.group("three"));
}
}
二、反向引用案例
三、结巴去重案例
四、算法题