前言
本博客是博主用于复习数据结构以及算法的博客,如果疏忽出现错误,还望各位指正。
正则表达式概念
正则表达式,又称规则表达式(Regular Expression),是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”),是计算机科学中的一个概念。
正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符以及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
许多程序设计语言都支持利用正则表达式进行字符串操作,如Java。
通过使用这些元字符和语法规则,可以构造出非常灵活和强大的正则表达式,以满足各种复杂的字符串匹配和处理需求。
我们一般的正则表达式都是贪婪的,尽可能多的匹配,若是想让其尽可能少的匹配,需要在后面加上一个?。
不过很多字符在Java中编写仍需要再加一个\转义字符。
符号 | 表示意义 |
---|---|
. | 可以匹配任意一个字符 |
\d | 匹配一个数字 |
\w | 匹配一个字母、数字或者下划线 |
\s | 匹配一个空白字符,包含Tab键 |
\D | 匹配一个非数字 |
\W | 匹配一个非(字母、数字或者下划线) |
\S | 匹配一个非空白字符 |
符号 | 数量意义 |
* | 任意个 |
+ | 至少一个 |
? | 0个或1个 |
{N} | N个 |
{N,M} | N到M个 |
{N,} | 至少N个 |
符号 | 其他意义 |
\b | 匹配一个单词边界,即b所在位置的字符为非单词字符 即要么是空格要么就是标点符号 反正不能是单词字符(大小写字母、数字和下划线) |
^ | 以……开头的 |
$ | 以……结尾的 |
^.*$ | 限定 |
[^.*] | 除了以……开头的 |
练手题
(Java)——(PTA)L1-059 敲笨钟-CSDN博客
(Java)——(PTA)L1-064 估值一亿的AI核心代码-CSDN博客