一、需求
如下文本,三段相同结构的数据,想要获取每段结构中‘重复的Ids ’后面的数字
2023-10-26 18:49:49
重复的Ids 26443,26575
要删除的Ids 4174,4199,4200,5550
2023-10-26 18:49:49
重复的Ids 26436,26443,26575
要删除的Ids 4166,4199,4200,5550
2023-10-26 18:49:49
重复的Ids 26436,26443,26575
要删除的Ids 4166,4174,4200,5550
2023-10-26 18:49:49
重复的Ids 26436
要删除的Ids 4166
二、实现
通过Notepad++ 和正则表达式 替换文本的方式,最后只留下想要的数字。
查找:.*?(要删除的Ids\s+)([\d,]+)
替换:$2\r
替换前:
替换后:
三、说明
查找表达式 .*?(要删除的Ids\s+)([\d,]+)
.*?
:匹配任意字符(除换行符外)零次或多次,使用非贪婪模式进行匹配。(要删除的resumeIds\s+)
:括号中的内容表示一个捕获组,匹配"要删除的resumeIds "这个具体文本,后面跟着一个或多个空白字符。([\d,]+)
:括号中的内容表示另一个捕获组,匹配一个或多个数字和逗号
替换表达式 $2\r
替换为捕获的第二部分