脚本专栏 
首页 > 脚本专栏 > 浏览文章

详解Sed命令的用法与正则表达式元字符

(编辑:jimmy 日期: 2024/11/16 浏览:3 次 )

sed命令用法

sed是一种流编辑器,它是文本处理中非常有用的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为『模式空间』(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。

1.简介

sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。

sed编辑器逐行处理文件(或输入),并将结果发送到屏幕。具体过程如下:首先sed把当前正在处理的行保存在一个临时缓存区中(也称为模式空间),然后处理临时缓冲区中的行,完成后把该行发送到屏幕上。sed每处理完一行就将其从临时缓冲区删除,然后将下一行读入,进行
处理和显示。处理完输入文件的最后一行后,sed便结束运行。sed把每一行都存在临时缓冲区中,对这个副本进行编辑,所以不会修改原文件。

2.定址

定址用于决定对哪些行进行编辑。地址的形式可以是数字、正则表达式、或二者的结合。如果没有指定地址,sed将处理输入文件的所有行。

地址是一个数字,则表示行号;是“$"符号,则表示最后一行。例如:sed -n '$p' /etc/issue 

3.命令与选项

sed命令告诉sed如何处理由地址指定的各输入行,如果没有指定地址则处理所有的输入行。

3.1 sed命令

a\

在当前行后添加一行或多行。多行时除最后一行外,每行末尾需用“\”续行    -a,只是显示,如果要真的更改文本,就要sed -i.bak ''   这样就会出来一个带bak格式的文件,这个文件是源文件

[root@entos74 app]#cat -n passwd.txt | sed '10,20a\       11 adadadadadada '

c\

用此符号后的新文本替换当前行中的文本。多行时除最后一行外,每行末尾需用"\"续行

cat -n passwd.txt | sed '10c\XXXXXXXXXXXXXXXXXX'

  i\
    在当前行之前插入文本。多行时除最后一行外,每行末尾需用"\"续行
    cat -n passwd.txt | sed '10i\XXXXXXXXXXXXXXXXXX'
  d
  删除行  :ss -ntl |sed '1d'       删除第一行
  h
  把模式空间里的内容复制到暂存缓冲区  
  H
  把模式空间里的内容追加到暂存缓冲区
  g
  把暂存缓冲区里的内容复制到模式空间,覆盖原有的内容
  G
  把暂存缓冲区的内容追加到模式空间里,追加在原有内容的后面
  p
 打印当前模式空间内容,追加到默认输出之后
  n
  读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理
  q
  结束或退出sed
  r
  从文件中读取输入行
  !
  对所选行以外的所有行应用命令
  s
  用一个字符串替换另一个
  g
  在行内进行全局替换:cat -n passwd.txt | sed 's@/bin/bash$@ /sbin/nologin@g'
  w
  将所选的行写入文件:sed '/^lixiaozi/w /app/lixiaozi.txt' passwd.txt
  x
  交换暂存缓冲区与模式空间的内容
  y
  将字符替换为另一字符(不能对正则表达式使用y命令) 

3.2 sed选项

  选项
  功能
  -e
  进行多项编辑,即对输入行应用多条sed命令时使用
  -n
  取消默认的输出
  -f
  指定sed脚本的文件名

4.退出状态

sed不向grep一样,不管是否找到指定的模式,它的退出状态都是0。只有当命令存在语法错误时,sed的退出状态才不是0。

5.正则表达式元字符

  与grep一样,sed也支持特殊元字符,来进行模式查找、替换。不同的是,sed使用的正则表达式是括在斜杠线"/"之间的模式。

如果要把正则表达式分隔符"/"改为另一个字符,比如o,只要在这个字符前加一个反斜线,在字符后跟上正则表达式,再跟上这个字符即可。例如:sed -n '\o^Myop' datafile
    元字符
  功能
  示例
  ^
  行首定位符
  /^my/   匹配所有以my开头的行
  $
  行尾定位符
  /my$/   匹配所有以my结尾的行
  .
  匹配除换行符以外的单个字符
  /m..y/   匹配包含字母m,后跟两个任意字符,再跟字母y的行
  *
  匹配零个或多个前导字符
  /my*/   匹配包含字母m,后跟零个或多个y字母的行
  []
  匹配指定字符组内的任一字符
  /[Mm]y/   匹配包含My或my的行
  [^]
  匹配不在指定字符组内的任一字符
  /[^Mm]y/   匹配包含y,但y之前的那个字符不是M或m的行
  \(..\)
  保存已匹配的字符
  1,20s/\(you\)self/\1r/   标记元字符之间的模式,并将其保存为标签1,之后可以使用\1来引用它。最多可以定义9个标签,从左边开始编号,最左边的是第一个。此例中,对第1到第20行进行处理,you被保存为标签1,如果发现youself,则替换为your。
  &
  保存查找串以便在替换串中引用
  s/my/**&**/    符号&代表查找串。my将被替换为**my**
  \<
  词首定位符
  /\<my/   匹配包含以my开头的单词的行
  \>
  词尾定位符
  /my\>/   匹配包含以my结尾的单词的行
  x\{m\}
  连续m个x
  /9\{5\}/ 匹配包含连续5个9的行
  x\{m,\}
  至少m个x
  /9\{5,\}/   匹配包含至少连续5个9的行
  x\{m,n\}
  至少m个,但不超过n个x
  /9\{5,7\}/   匹配包含连续5到7个9的行

6.范例 

6.1 p命令

命令p用于显示模式空间的内容。默认情况下,sed把输入行打印在屏幕上,选项-n用于取消默认的打印操作。当选项-n和命令p同时出现时,sed可打印选定的内容。 

sed '/my/p' datafile
#默认情况下,sed把所有输入行都打印在标准输出上。如果某行匹配模式my,p命令将把该行另外打印一遍。
[root@entos74 ~]#sed -n '3p' filelist.txt
只打印第三行
只显示指定行范围的文件内容,例如:
#  只查看文件的第20行到第30行,并且带上行号
cat -n /etc/passwd | sed  -n '20,30p' 

6.2 d命令

命令d用于删除输入行。sed先将输入行从文件复制到模式空间里,然后对该行执行sed命令,最后将模式空间里的内容显示在屏幕上。如果发出的是命令d,当前模式空间里的输入行会被删除,不被显示。

sed '$d' datafile
#删除最后一行,其余的都被显示
cat -n passwd.txt | sed '/mail/,25d'
#删除包含"mail"的行到第25行的内容
地址是逗号分隔的,那么需要处理的地址是这两行之间的范围(包括这两行在内)。范围可以用数字、正则表达式、或二者的组合表示。例如:
sed '2,5d' datafile
#删除第二到第五行
sed '/My/,/You/d' datafile
#删除包含"My"的行到包含"You"的行之间的行

6.3 s命令

sed 's/^My/You/g' datafile
#命令末端的g表示在行内进行全局替换,也就是说如果某行出现多个My,所有的My都被替换为You。 

6.4 e选项

-e是编辑命令,用于sed执行多个编辑任务的情况下。在下一行开始编辑前,所有的编辑动作将应用到模式缓冲区中的行上。

sed -e '1,10d' -e 's/My/Your/g' datafile

#选项-e用于进行多重编辑。第一重编辑删除第1-3行。第二重编辑将出现的所有My替换为Your。因为是逐行进行这两项编辑(即这两个命令都在模式空间的当前行上执行),所以编辑命令的顺序会影响结果。

6.5 w命令

sed -n '/hrwang/w me.txt' datafile 

6.6 a\ 命令

a\ 命令是追加命令,追加将添加新文本到文件中当前行(即读入模式缓冲区中的行)的后面。所追加的文本行位于sed命令的下方另起一行。如果要追加的内容超过一行,则每一行都必须以反斜线结束,最后一行除外。最后一行将以引号和文件名结束。

sed '/^hrwang/a\
>hrwang and mjfan are husband\
>and wife' datafile
#如果在datafile文件中发现匹配以hrwang开头的行,则在该行下面追加hrwang and mjfan are husband and wife 

6.7 i\ 命令

i\ 命令是在当前行的前面插入新的文本。 

6.8 c\ 命令

sed使用该命令将已有文本修改成新的文本。 

6.9 n命令

sed使用该命令获取输入文件的下一行,并将其读入到模式缓冲区中,任何sed命令都将应用到匹配行紧接着的下一行上。

sed '/hrwang/{n;s/My/Your/;}' datafile

总结

以上所述是小编给大家介绍的详解Sed命令的用法与正则表达式元字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!

上一篇:Git代码提交流程及git命令汇总(基础篇)
下一篇:如何使用Shell脚本掩盖Linux服务器上的操作痕迹(推荐)
一句话新闻
微软与英特尔等合作伙伴联合定义“AI PC”:键盘需配有Copilot物理按键
几个月来,英特尔、微软、AMD和其它厂商都在共同推动“AI PC”的想法,朝着更多的AI功能迈进。在近日,英特尔在台北举行的开发者活动中,也宣布了关于AI PC加速计划、新的PC开发者计划和独立硬件供应商计划。
在此次发布会上,英特尔还发布了全新的全新的酷睿Ultra Meteor Lake NUC开发套件,以及联合微软等合作伙伴联合定义“AI PC”的定义标准。