一、sed编辑器
- sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。
- sed编辑器可以根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么存储在一个命令文本文件中。
1、sed的执行过程
- 读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)。
- 执行:默认情况下,所有的sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则sed 命令 将会在所有的行上依次执行。
- 显示:发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。
Sed是从文件或管道中读取一行,处理一行,输出一行;再读取一行,再处理一行,再输出一行,直到最后一行。每当处理一行时,把当前处理的行存储在临时缓冲区中,称为模式空间(PatternSpace),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完,直到文件末尾。
一次处理一行的设计模式使得sed性能很高,sed在读取大文件时不会出现卡顿的现象
二、Sed基本语法
通常情况下调用 sed 命令有两种格式,如下所示。其中,“参数”是指操作的目标文件, 当存在多个操作对象时用,文件之间用逗号“,”分隔
scriptfile 表示脚本文件,需要用“-f” 选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。
sed [选项] '操作' 参数
sed [选项] -f scriptfile 参数
常用选项
-e | 表示用指定命令或者脚本来处理输入的文本文件,只有一个编辑命令时可省略 |
-f | 表示用指定的脚本文件来处理输入的文本文件 |
-n | 表示仅显示处理后的结果 |
-i.bak | 备份文件并直接编辑文本文件,不输出结果 |
-r, -E | 使用扩展正则表达式 |
-s | 将多个文件视为独立文件,而不是单个连续的长文件流 |
常用操作
指令 | 作用 |
---|---|
a | 增加,在当前行下面增加一行指定内容 |
c | 替换,将选定行替换为指定内容 |
d | 删除,删除选定的行 |
i | 插入,在选定行上面插入一行指定内容 |
p | 打印,输出指定行 |
s | 替换,替换指定字符,格式:“行范围 s/旧字符串/新字符串” |
y | 字符转换 |
r | 指定读取文件 |
w | 保存为文件 |
sed -i 作为行编辑器,一旦生效,无法撤回,所以强烈建议修改的时候加上-i.bak,可以进行备份
三、Sed用法
sed最为核心的功能是 增 删 改 查
1、输出指定的行
sed -n 'p' passwd.txt //输出所有内容,等同于 cat test.txt
sed -n '3p' passwd.txt //输出第 3 行
sed -n '3,5p' passwd.txt //输出 3~5 行
sed -n 'p;n' passwd.txt //输出所有奇数行,n 表示读入下一行资料
sed -n 'n;p' passwd.txt //输出所有偶数行,n 表示读入下一行资料
sed -n '1,5{p;n}' passwd.txt //输出第 1~5 行之间的奇数行(第 1、3、5 行)
sed -n '10,${n;p}' passwd.txt //输出第 10 行至文件尾之间的偶数行
sed -n '2,+3p' passwd.txt //从第2行开始,连续3行进行输出,即输出2~5行
结合正则表达式输出指定行
sed 命令结合正则表达式时,格式略有不同,正则表达式以“/”包围。
注:如果遇到特殊符号的情况,扩展正则还需要转义字符“\”。
sed -n '/w/p' 2.txt //输出包含w 的行
sed -n '/w/=' 2.txt //输出包含w 的行所在的行号,等号(=)用来输出行号
sed -n '/^2/p' 2.txt //输出以2 开头的行
sed -n '/[0-9]$/p' 2.txt //输出以数字结尾的行
sed -n '/\<qqqqq\>/p' 2.txt //输出包含单词qqqqq 的行
2、插入符合条件的行
使用插入时,如果添加多行数据,除最后一行外,每行末尾都需要用“\n”符号表示数据未完结,换行。
sed '/q/i 66' 2.txt //在含有q行的前面一行添加66
sed '/w/a 66' 2.txt //在含有w行的下一行添加66
sed '3a66' 2.txt //在第3行之后插入66
3、删除符合条件的行
nl命令用于计算文件的行数,结合该命令可以更加直观地查看到命令执行的结果。
nl 2.txt | sed '3d' //删除第3行
nl 2.txt | sed '3,5d' //删除第3~5行
nl 2.txt |sed '/cross/d' //删除包含 cross 的行,原本的第 8 行被删除;如果要删除不包含 cross 的行,用!符号表示取反操作, 如'/cross/!d'
sed '/^[a-z]/d' 2.txt //删除以小写字母开头的行
sed '/\.$/d' 2.txt //删除以.结尾的行
4、替换符合条件的文本
sed 's/q/zz/' 2.txt //将每行中的第一个q 替换为 zz
sed 's/l/L/2' 2.txt //将每行中的第 2 个 l 替换为 L
sed 's/the/THE/g' 2.txt //将文件中的所有the 替换为 THE
sed 's/o//g' 2.txt //将文件中的所有o 删除(替换为空串)
sed 's/^/#/' 2.txt //在每行行首插入#号
sed '/the/s/^/#/' 2.txt //在包含the 的每行行首插入#号
sed '3,5s/the/THE/g' 2.txt //将第 3~5 行中的所有 the 替换为 THE
sed '/the/s/o/O/g' 2.txt //将包含the 的所有行中的 o 都替换为 O
5、迁移符合条件的文本
常用参数
H | 复制到剪贴板 |
g、G | 将剪贴板中的数据覆盖/追加至指定行 |
w | 保存为文件 |
r | 读取指定文件 |
a | 追加指定内容。具体操作方法如下所示 |
I,i | 忽略大小写 |
sed '/the/{H;d};$G' text.txt //将包含the 的行迁移至文件末尾,{;}用于多个操作
sed '1,5{H;d};14G' text.txt //将第 1~5 行内容转移至第 14 行后
sed '/the/w out.file' text.txt //将包含the 的行另存为文件 out.file
sed '/the/r /etc/hostname' text.txt //将文件/etc/hostname 的内容添加到包含 the 的每行以后
sed '3aNew' text.txt //在第 3 行后插入一个新行,内容为New
sed '/the/aNew' text.txt //在包含the 的每行后插入一个新行,内容为 New
sed '3aNew1\nNew2' text.txt //在第 3 行后插入多行内容,中间的\n 表示换行
6、使用脚本编辑文件
使用 sed 脚本将多个编辑指令存放到文件中(每行一条编辑指令),通过“-f”选项来调用。
例如执行以下命令即可将第 1~5 行内容转移至第 14 行后,等同于sed ‘1,5{H;d};16G’ text.txt
总结
- 1.sed命令是一种流编辑器读取文件会进行逐行读取加上指令操作,所以过大的文件一定要拆分后再交给sed处理
- 2.sed -r 搭配扩展正则表达式使用,使用\{n\} \{n,\} \{n,m\} 不需要加“\”
- 3. 用 -i 时一定要先备份(尤其对重要文件的操作),或者时先实验好确定无误时,再使用 -i
- 4.sed 命令 的重点在于增删改查四个功能,可以运用在脚本中对重要文件配置的修改,添加等作用尤其有效