文本处理工具之sed

                     文本处理工具之sed

 sed的简介

   1、Stream EDitor, 行编辑器
        2、sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。 sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

   3、sed所具有的功能:数据的替换、删除、新增等。sed处理的数据可能是一些关键字、也可能会是一些特定的行。sed对文本有着强大的处理功能,下面我们来一一介绍。

sed的基础使用

   1、sed的语法结构

     sed [OPTION]… {script} [input-file].. [actions]

   2、选项[OPTION]
     -r: 支持拓展正则表达式

     -n:静默模式

     -e:指定多脚本运行

     -f /path/to/scripts_file:从指定文件中读取脚本运行

     -i:直接修改源文件

   3、script脚本 :‘地址命令’

     1)地址界定

      1)不给地址:对全文进行处理

      2)单地址:
        #:指定的行   
        /pattern/:被此处模式所能够匹配到的每一行

      3)地址范围:
        #1,#2:表示从第#1行到#2行
        #,+n:表示从第#行开始,一直到向下的n行
        /pat1/,/pat2/:表示从第一次被模式/part1/所匹配的行开始,到第一次被模式/part2/匹配的行结束,中间所有的行
        #,/pat1/:表示从#行开始到第一次被模式/part1/匹配的行结束,中间所有的行

      (4) ~:步进 如下:
        1~2 奇数行
        2~2 偶数行

     2)sed编辑命令

        d: 删除模式空间匹配的行
        p: 显示模式空间中的内容
        a [\]text:在指定行后面追加文本支持使用\n实现多行追加
        i [\]text:在行前面插入文本
        c [\]text:替换行为单行或多行文本
        w /path/somefile: 保存模式匹配的行至指定文件
        r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后
        =: 为模式空间中的行打印行号
        !:模式空间中匹配行取反处理

     3)查找替换:

        s/part1/string/[OPTIONS]:将part1匹配到内容替换为string,根据选项进行处理。其中OPTIONS可以不加。

        其分界符可为:s###、s@@@

        常用OPTIONS:

          g:全局的

          i:不区分大小写

          w /PATH/TO/SOMEFILE:把指定内容另存至指定的文件中

          r /PATH/TO/SOMEFILE:在文件指定位置插入另一个文件的内容。

          p:显示替换成功的行

   4、sed命令使用示例:

        1)删除/etc/fstab文件中行首为#的#字符

                                    文本处理工具之sed

                                    文本处理工具之sed

        2)将/etc/fstab文件中的奇数行另存至/tmp/fstab1

                                    文本处理工具之sed

         (3)利用sed命令取出一路径的基名和路径名

                                   文本处理工具之sed

sed一些高级使用

1、sed除了由‘模式空间’,还有一个‘保持空间’

  sed的工作机制是每次读取一行至模式空间中,在模式空间中完成处理,将处理结果输出值标准输出设备。在模式空间中处理一行内容后继续处理下一行,那么对于处理过的行可能还有其它的处理,因此可以先把处理过的行‘传输’至保持空间中,然后在后续的处理中再次‘传输’至模式空间中进行再次处理。

2、sed工具支持一些高级命令运用到保持空间中。

    h: 把模式空间中的内容覆盖至保持空间中
    H:把模式空间中的内容追加至保持空间中
    g: 从保持空间取出数据覆盖至模式空间
    G:从保持空间取出内容追加至模式空间
    x: 把模式空间中的内容与保持空间中的内容进行互换
    n: 读取匹配到的行的下一行覆盖至模式空间
    N:读取匹配到的行的下一行追加至模式空间
    d: 删除模式空间中的行
    D:删除当前模式空间开端至\n的内容( 不再传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

3、sed高级使用一些示例

   1)统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

                 文本处理工具之sed

   (2统计/etc/issue文件中每个单词的出现次数,并排序

      文本处理工具之sed
   (3将数字1到10 以’NN+1’形式输出,其中N为奇数,N+1为偶数

      文本处理工具之sed

     

原创文章,作者:zq,如若转载,请注明出处:http://www.178linux.com/74544

(0)
zqzq
上一篇 2017-05-01 20:15
下一篇 2017-05-01 21:27

相关推荐

  • 软件包管理详解

      软件包管理器 1、功能: (1)将软件包打包成一个文件,其中包括: ①二进制程序 ②库文件 ③配置文件 ④帮助文件 (2)生成数据库,追中所安装的每一个文件。 2、软件包管理器的核心功能: (1)制作软件包 (2)安装、卸载、升级、查询、校验 3、不同发行版的不同的…

    2017-08-11
  • 数据结构-栈和队列

    1.栈 1.1 栈的定义 栈是一种特殊的线性表。其特殊性在于限定插入和删除数据元素的操作只能在线性表的一端进行。如下所示: 结论:后进先出(Last In First Out),简称为LIFO线性表。 栈的基本运算有六种: 构造空栈:InitStack(S)、 判栈空: StackEmpty(S)、 判栈满: StackFull(S)、 …

    Linux干货 2015-04-07
  • N25期–第十四周作业

    系统的INPUT和OUTPUT默认策略为DROP; # iptables -P INPUT DROP # iptables -P OUTPUT DROP 1、 限制本地主机的web服务器在周一不允许访问;新请求的速率不能超过100个每秒;web服务器包含了admin字符串的页面不允许访问;web服务器仅允许响应报文离开本机;   #iptables…

    Linux干货 2017-04-10
  • 链接的“软”与“硬”

    前言     类似Windows系统,Linux系统在进行文件管理时,也会引入链接概念。而链接又分为软链接和硬链接,两种链接适用于不同场合、不同用途,各有优缺点。在介绍软硬两种链接之前,需要先引入inode的概念。 Inode:     系统在管理文件时,为了有序寻址,会将元数据(metadata)和用户数据…

    Linux干货 2016-10-20
  • 马哥教育21期网络班—第一周课程+练习

    计算机的组成及功能 根据冯·诺依曼原理 现在计算机有五部分组成 分别是:运算器、控制器、存储器、输入设备和输出设备 现在把运算器和控制器做到一块就是所谓的CPU CPU = 运算器+控制器 存储器:memory 用于存储信息的记忆设备,存储器分为ROM和RAM 编址存储设备 ROM:只读存储器,寻址地址空间的组成部分 RAM:随机存储器 输入和输出设备: 输…

    Linux干货 2016-06-26
  • LINUX课堂笔记(第一周)

    2018.03.05 LINUX: 切换虚拟终端:CTRL+ALT+F[1-6] 查看当前得终端设备命令:tty 查看内存: cat /proc/meminfo free -h 查看分区: cat /proc/partitions lsblk 查看CPU: lscpu cat /proc/cpuinfo 查看版本 cat /etc/centos-releas…

    Linux干货 2018-03-15