Linux系统三剑客之grep和正则表达式的介绍(一)

1.正则表达式

目录

1.正则表达式

1.什么是正则表达式 ?

2.正则表达式的使用场景

3.正则表达式字符表示

4.它们之间的区别

2.grep命令

作用:

语法:

说明:

选项:options

重点

实例

3.后面的下次再更新。 


1.什么是正则表达式 ?

一个正则表达式就是描述了一个字符串集合的方式。正则表达式的表示就是一些特殊符号的组合,而每个符号代表着一些具体的意思。符合的组合就定义了一套规则和方法,其主要作用就是从大量文本从匹配出符合条件行。

2.正则表达式的使用场景

在Linux中,正则表达式的主要使用场景就是文本处理三剑客。grep,sed,awk .除此之外,vi指令也支持正则表达式。

3.正则表达式字符表示

在正则表达式中,又可以分为基本正则表达式和扩展正则表达式 。其主要区别在于:

  • 基本正则表达式只认识元字符,其元字符主要包括:^ $ . [] * ,具体含义见下表格

  • 扩展正则表达式有添加了() {} ? + | 等符号

以下为各个元字符的含义

元字符含义实例
^匹配行首^abc : 匹配以abc开头的字符
$匹配行尾abc$ : 匹配以abc结尾的字符
^$空行表示空行的意思
.匹配任意单个字符.a : 匹配任意和a结合的两个字符,其中必须是在后面
*字符* 匹配0或多个此字符*.a : 匹配任意个一个或多个含有a的字符
.*代表任意多个字符就是代表任意多个字符
\屏蔽一个元字符的特殊含义表示去掉有意义的元字符的含义
[]匹配中括号内的字符[abc] : 代表匹配a或b或c
[^abc]匹配不包含括号内的任意字符[^abc] : 代表对abc的取反 ,这个^abc意义不同。

扩展正则中支持的字符

字符含义实例
+重复前一个字符一次或多次a+ : 匹配包含一个a或多个a的字符 。
重复前面一个字符0次或一次a? :匹配包含0个或一个a字符
|同时匹配|两边的字符"abc\|bcd" : 匹配包含abc或bcd的字符
()可以和()的字符分组匹配abc (d\|e\|f)” :匹配abcd,abce,abcf字符
{}匹配前面字符的次数
{n}abc{2}” : 至少匹配abc两次
{n,m}abc{2,5}” : 匹配abc两到五次

预定义字符类

正则表达式描述示例
[:alnum:][a-zA-Z0-9]匹配任意一个字母或数字字符[[:alnum:]]+
[:alpha:]匹配任意一个字母字符(包括大小写字母)[[:alpha:]]
[:blank:]空格与制表符(横向纵向)[[:blank:]]
[:digit:]匹配任意一个数字字符[[:digit:]]+
[:lower:]匹配小写字母[[:lower:]]
[:upper:]匹配大写字母[[:upper:]]
[:punct:]匹配标点符号[[:punct:]]
[:space:]匹配一个包括换行符,回车等在内的所有空白符[[:space:]]+
[:graph:]匹配任何一个可以看得见的且可以打印的字符[[:graph:]]
[:xdigit:]任何一个十六进制数[[:xdigit:]]+
[:cntrl:]任何一个控制字符(ASCII字符集中的前32个字符)[[:cntrl:]]
[:print:]任何一个可以打印的字符[[:print:]]
4.它们之间的区别

在上面我们提到正则包括基础正则和扩展正则,但是它们有什么区别呢?在什么地方使用呢 ? 接下来我们主要说明在Linux 三剑客中的不同(grep,sed,awk)

  • grep : 在grep中,如果只是使用grep ,那只能使用原字符的正则以及预定义字符类,而若想使用扩展正则中包含的字符,就必须在grep后加参数-E 。

  • sed :若要使用而扩展正则中包含的字符,就必须在sed后加参数-r。

2.grep命令

作用
  • 用于打印匹配给定模式的行

语法:

grep [options] PATTERN [FILE...] ​ grep [options] [-e PATTERN | -f FILE] [FILE...]

说明:

grep指令用于搜索所给定的模式(PATTERN )的FILE 文件里的内容 ,如果从文件内容里找到了该模式的文件内容,grep会把匹配的该行显示出来。若不指定任何文件,或给的文件名为- , 则grep会从标准输入读取内容。

 另外,也可以使用两个变种程序 egrep 和 fgrep 。 Egrep 与 grep -E 相同。 Fgrep 与 grep -F 相同。

选项:options
说明: 以下的NUM代表的是一个数字,代表的是行数
-A NUM 或者 --after-context=NUM
除了显示符合条件的那一行之外,并显示该行之后NUM行的内容
-a 或者--text
将一个二进制文件视为一个文本文件来处理;它与--binary-files=text 选项等价。

-B NUM 或者--before-context=NUM
除了显示符合条件的那一行之外,并显示该行之前NUM行的内容。

-C NUM 或者--context=NUM
除了显示符合条件的那一行之外,并显示该行之前和之后的NUM行的内容

-b 或者--byte-offset
在输出的每行前面同时打印出当前行在输入文件中的字节偏移量。

--colour[=WHEN] 或者 --color[=WHEN]
在匹配的行中,已匹配到字符串进行着色显示。WHEN可以是never,always,或是auto。

-c 或者--count
计算符合条件的行数

-d ACTION 或者 --directories=ACTION
如果输入文件是一个目录,使用动作ACTION来处理它。
默认情况下,动作ACTION是read,意味着目录将视为普通文件那样来读。
如果动作 ACTION是skip ,将不处理而直接跳过目录。
如果动作ACTION是recurse,grep 将递归地读每一目录下的所有文件。这样做和-r选项等价。

-E 或者 --extended-regexp
将E后面的模式作为一个正则表达式来使用。

-e PATTERN 或者 --regexp=PATTERN
使用PATTERN作为查找文件内容的模式(支持正则),但是在单条命令中可使用多个-e选项

-F 或者 --fixed-strings
将模式 PATTERN 视为一个固定的字符串的列表,用新行 (newlines) 分隔,只要匹配其中之一即可。

-f FILE 或者--file=FILE
从文件 FILE 中获取模式,每行一个。空文件含有0个模式,因此不匹配任何东西。

-G 或者--basic-regexp
将模式 PATTERN 作为一个基本的正则表达式这是默认值。

-H 或者 --with-filename
为每个匹配打印文件名。

-h 或者 --no-filename
当搜索多个文件时,禁止在输出的前面加上文件名前缀。

-i 或者 --ignore-case
忽略大小写的区别

-L 或者 --files-without-match
打印在文件内容中无法找到匹配后的文件名称

-l 或者 --files-with-matches
打印出在文件内容中找到匹配后的文件名

-m NUM 或者 --max-count=NUM
在找到NUM个匹配的行之后,不再读这个文件。

-n 或者 --line-number
在输出的每行前面加上它所在的文件中它的行号。

-o 或者 --only-matching
只显示匹配的行中与 PATTERN 相匹配的部分。

--label=LABEL
将来自标准输入的匹配输出视为来自输入文件LABEL的值

--line-buffering
使用行缓冲,it can be a performance penality.

-q, --quiet, --silent
不显示任何信息。

-R, -r, --recursive
递归地读每一目录下的所有文件。这样做和 -d recurse选项等价。

--include=PATTERN
仅仅在搜索匹配 PATTERN 的文件时在目录中递归搜索。

--exclude=PATTERN
在目录中递归搜索,但是跳过匹配 PATTERN 的文件。

-s 或者 --no-messages
禁止输出关于文件不存在或不可读的错误信息。

-u 或者 --unix-byte-offsets
报告Unix风格的字节偏移量。这个开关使得grep报告字节偏移量时,将文件作为Unix
风格的文本文件看待,也就是说将CR字符去掉。这将产生与在一台Unix主机上运行grep完全相同的结果。除非同时使用-b选项,否则这个选项无效。这个选项在MS-DOS和MS-Windows之外的系统中无效。

-V 或者 --version
向标准错误输出打印 grep 的版本号。

-v 或者 invert-match
显示不包含匹配模式的所有行。

-w 或者 --word-regexp
只选择含有能组成完整的词的匹配的行。判断方法是匹配的子字符串必须是一行的开始,或者是在一个不可能

-x 或者 --line-regexp
完全匹配。

-Z, --null
文件内容全部显示,不同字体通过颜色加以标注
重点

虽然在上面我们可以看到,grep中有很多选项,但是在工作中,大多数的选项是用不到的,这里我们划一下重点。

常用参数

-E将后面的模式作为一个正则表达式(扩展正则)
-e支持一个命令中多个正则匹配
-i忽略大小写
-n在匹配的行前加入编号
-v只显示不匹配的行
实例

使用到文件info,通过grep来进行过滤,info的文件内容如下:

  1. 查找文件info中包含ccc的内容并打印行数

grep -n "ccc" info

2.查找文件info中包含ggg且忽略大小写的字符并打印,

grep -i "ggg" info

3.过滤掉含有ccc的行

grep -v "ccc" info

 

4.查找包含ddd,eee,fff的行(注意:以下匹配用到正则)

grep -E "ddd|eee|fff" info

5.查找以c开头的行

grep ^c info

6.查找以ccx开头且结尾的行

grep ^ccx$ info

7.查找d字符前可以是任意字符的行

grep .d info

8.查找包含一个或多个d字符的行

grep -E d{1} info

9.显示包含a,b,c的字符的行 ; 显示不包含a,b,c字符的行

包含:grep -i ^[abc] info
不包含: grep -i [^abc] info (是全部字符不包含a或b或c)

10.显示包含一个或多个含有a字符的行

grep -E a+ info

11.查找以cc开头且包含c,x,ld字符的行

grep -E "cc(c|x|ld)" info

12.查找文件中所有的大写字符

grep [[:upper:]] info

13.匹配任意一个字母和数字字符

grep [[:alnum:]] info

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/332976.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言位域定义与使用

参考文章&#xff1a; 【C语言】详解位域定义与使用_c 语言定义位-CSDN博客 代码有修改&#xff0c;主要是变量初始化&#xff0c;原程序可能相应内存不能写。且第二个字节F不好区分各位。 #include <stdio.h>typedef struct {unsigned short b1 : 1;unsigned short b…

情人节专属--HTML制作情人节告白爱心

💕效果展示 💕html展示 <!DOCTYPE html> <html lang="en" > <head>

ros2仿真学习04 -turtlebot3实现cartographer算法建图演示

安装看这里 https://blog.csdn.net/hai411741962/article/details/135619608?spm1001.2014.3001.5502 虚拟机配置&#xff1a; 内存16g cpu 4 核 磁盘40G,20G 不够 启动仿真 ros2 launch turtlebot3_gazebo turtlebot3_world.launch.py启动成功如下 启动建图 重新开一个…

浅谈情绪的分类合集

什么是情绪分类 情绪分类&#xff0c;是指区分或者对比一种情绪与另一种情绪的方法&#xff0c;目前在情绪研究&#xff08;emotion research&#xff09;与情感科学&#xff08;affective science&#xff09;是具有争议的问题。有两个讨论情绪分类的基本观点&#xff1a; 情…

【计算机组成与体系结构Ⅱ】Tomasulo 算法模拟和分析(实验)

实验5&#xff1a;Tomasulo 算法模拟和分析 一、实验目的 1&#xff1a;加深对指令级并行性及开发的理解。 2&#xff1a;加深对 Tomasulo 算法的理解。 3&#xff1a;掌握 Tomasulo 算法在指令流出、执行、写结果各阶段对浮点操作指令以及 load 和 store 指令进行了什么处…

CC工具箱使用指南:【用地用海指标汇总】

一、简介 在湘源上画的规划用地图&#xff0c;想导出规划指标表是很容易的。 但是现在很多用地图最终是要在ArcGIS中处理的&#xff0c;想再导出指标表就比较麻烦。 这个工具的主要功能就是在ArcGIS中汇总统计&#xff0c;生成类似湘源的Excel格式用地指标表。 二、工具参数…

20240117在本地机器识别OCR法语电影的字幕效果PK

20240117在本地机器识别OCR法语电影的字幕效果PK 2024/1/17 11:18 1959 - Jirai Cracher Sur Vos Tombes [Gast, Vian].avi https://www.pianbar.net//drama/52892.html 1959[我唾弃你的坟墓]Jirai cracher sur vos tombes[BT下载/迅雷下载] magnet:?xturn:btih:7c9c99d9d048…

【备战蓝桥杯】图论重点 敲黑板啦!

蓝桥杯备赛 | 洛谷做题打卡day11 文章目录 蓝桥杯备赛 | 洛谷做题打卡day11杂务题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 题解代码我的一些话 杂务 题目描述 John 的农场在给奶牛挤奶前有很多杂务要完成&#xff0c;每一项杂务都需要一定的时间来完成它。比如&a…

canvas绘制不同样式的六角星(示例源代码)

查看专栏目录 canvas实例应用100专栏&#xff0c;提供canvas的基础知识&#xff0c;高级动画&#xff0c;相关应用扩展等信息。canvas作为html的一部分&#xff0c;是图像图标地图可视化的一个重要的基础&#xff0c;学好了canvas&#xff0c;在其他的一些应用上将会起到非常重…

Python如何便捷的执行JavaScript代码,调用JS函数

文章目录 📖 介绍 📖🏡 环境 🏡📒 实现方法 📒📝 安装📝 使用⚓️ 相关链接 ⚓️📖 介绍 📖 Python在写一些爬虫代码的时候经常需要接触到JS逆向,其中如何让Python便捷的执行JS代码就成了一个很关键的问题,本文分享一种便捷的方式实现这个需求。 🏡 环…

司铭宇老师:二手房地产中介销售培训:二手房经纪人必备的七种销售能力

二手房地产中介销售培训&#xff1a;二手房经纪人必备的七种销售能力 在房地产行业中&#xff0c;二手房经纪人扮演着至关重要的角色。他们需要具备一系列的销售能力&#xff0c;以便更好地为客户服务&#xff0c;实现业绩增长。本文将详细介绍二手房经纪人必备的七种销售能力…

带你解析Git的基础功能(三)

文章目录 前言一.远程仓库的概念二.远程仓库的操作2.1新建远程仓库2.2 克隆远程仓库2.3 向远程仓库推送2.4 拉取远程仓库2.5 忽略特殊⽂件2.6 标签管理 三.Git实战场景3.1 Git多人实战场景一准备工作由开发者1和开发者2新增加文件内容。将dev的文件合并到master上总结 3.2 Git多…

20240118-最小下降路径总和

昨天的爬楼梯以前写过&#xff0c;是一道基础的动态规划&#xff0c;就不重新写了。 题目要求 给定一个n*n的矩阵数组&#xff0c;返回通过矩阵的任何下降路径的最小和。 下降路径从第一行中的任何元素开始&#xff0c;并选择下一行中正下方或左右对角线的元素。具体来说&am…

【Flink-1.17-教程】-【三】Flink 运行架构、Flink 核心概念【并行度、算子链、任务槽】、Flink 作业提交流程

【Flink-1.17-教程】-【三】Flink 运行架构、Flink 核心概念【并行度、算子链、任务槽】、Flink 作业提交流程 1&#xff09;系统架构1.1.系统成员组成1.2.作业提交流程 2&#xff09;核心概念2.1. 并行度&#xff08;Parallelism&#xff09;2.1.1.并行子任务和并行度2.1.2.并…

如何无公网ip使用Potplayer访问群晖NAS中储存的本地资源【内网穿透】

文章目录 本教程解决的问题是&#xff1a;按照本教程方法操作后&#xff0c;达到的效果是&#xff1a;1 使用环境要求&#xff1a;2 配置webdav3 测试局域网使用potplayer访问webdav3 内网穿透&#xff0c;映射至公网4 使用固定地址在potplayer访问webdav ​ 国内流媒体平台的内…

2023 年顶级前端工具

谁不喜欢一个好的前端工具&#xff1f;在本综述中&#xff0c;您将找到去年流行的有用的前端工具&#xff0c;它们将帮助您加快开发工作流程。让我们深入了解一下&#xff01; 在过去的 12 个月里&#xff0c;我在我的时事通讯 Web Tools Weekly 中分享了数百种工具。我为前端…

Flink TaskManager内存管理机制介绍与调优总结

内存模型 因为 TaskManager 是负责执行用户代码的角色&#xff0c;一般配置 TaskManager 内存的情况会比较多&#xff0c;所以本文当作重点讲解。根据实际需求为 TaskManager 配置内存将有助于减少 Flink 的资源占用&#xff0c;增强作业运行的稳定性。 TaskManager 内…

Android Dialog setCanceledOnTouchOutside失效,点击dialog外面不消失

前言&#xff1a;有一个需求需要点击dialog外面要消失&#xff0c;本来以为很简单结果设置了一直未生效 setCanceledOnTouchOutside(true); 问了半天chat-gpt4结果给的答案都不明显 查看代码发现设置了style&#xff0c;于是尝试去除这个style&#xff0c;结果点击setCancele…

如何进行高效过滤器检漏:法规标准对比及检漏步骤指南

高效检漏光度计扫描法作为一种关键的高效过滤器检漏手段&#xff0c;在国内受到广泛应用。为确保其有效性和合规性&#xff0c;国内相关法规和标准对其进行了详细规定。本文将对比相关法规&#xff0c;并特别关注检漏过程中的详细步骤。 关于中邦兴业 北京中邦兴业科技有限公司…

买家福音:亚马逊鲲鹏系统全自动操作助你轻松搞定一切

我一直以来都是亚马逊的忠实用户&#xff0c;但是最近我发现了一款真正令人惊叹的工具&#xff0c;改变了我在平台上的经验。我想分享一下我的感受&#xff0c;最近&#xff0c;我得知并尝试了亚马逊鲲鹏系统&#xff0c;简直是为买家账号管理量身定制的利器。在我账号过多时&a…