`

ma系列之-12-文本处理工具sed awk

 
阅读更多

 

 0 linux三个文本处理工具:
   grep, sed(流编辑器), awk 

 

 

1 sed基本工作流程:

 

是行编辑器,

每一次把一行读取到内存中,后在内存中根据匹配模式,如果匹配则进行编辑(比如截取),

并把编辑后的结果输出到屏幕中.

sed仅仅是将匹配到的文本放在模式空间中进行处理,因此不会破坏原文本的内容。

 

2 sed写法格式

 

 

sed [options] 'AddressCommand' file ...   表示针对file,根据操作位置address来执行command命令,动态编辑文件内容,格式中,操作内容和命令之间不需要有空格
  options如下:
 -n: 静默模式,不再默认显示模式空间中的内容
 -i: 直接修改原文件
 -e SCRIPT -e SCRIPT:可以同时执行多个脚本
 -f /PATH/TO/SED_SCRIPT
 sed -f /path/to/scripts  file
 -r: 表示使用扩展正则表达式

 

 sed操作Address介绍:

Address:指定地址/操作范围, 如下是定位操作范围的定义方法

 

 

方式1、StartLine,EndLine   指定起始结束行
 比如1,100 表示指定1-100行的范围address
 $:最后一行
 $-1: 倒数第二行
 
方式2、/RegExp/  根据正则指定操作位置
 /^root/  表示以root开头的行
 
方式3、/pattern1/,/pattern2/  
 第一次被pattern1匹配到的行开始,至第一次被pattern2匹配到的行结束,这中间的所有行
 
方式4、LineNumber
  指定精确的行
 
方式5、StartLine, +N
 从startLine开始,向后的N行;

 

sed COMMAND介绍:  

 

d: 删除符合条件的行;   eg:  # sed '1,2d' sedfile 将1,2行的内容删除,并输出在控制台 此时 sedfile的内容不会变更 
								# sed '/oot/d' /etc/fstab

	p: 显示符合条件的行;
	a \string: 在指定的行后面追加新行,内容为string
		\n:可以用于换行
	i \string: 在指定的行前面添加新行,内容为string
	r FILE: 将指定的文件的内容添加至符合条件的行处   # sed '1,2r /etc/issue' /etc/fstab 将文件/etc/fstab第1行,第二行后面分别增加/etc/issue文件内容
	w FILE: 将地址指定的范围内的行另存至指定的文件中;  
	s/pattern/string/修饰符: 查找并替换,默认只替换每行中第一次被模式匹配到的字符串,将查找模式pattern查找匹配到的字符串替换成string指定的字符
		加修饰符
		g: 全局替换
		i: 忽略字符大小写
		eg: ----> 商标表中修改配置文件: sed -i "s/%current_date%/$current_date/g" $target_dir/$ql   全局直接在目标文件$q内将字符%current_date%替换为$current_date这个变量的值
	s/// ---> 这种分隔符不仅仅限制于/,也可以是 s###, s@@@	
		\(\), \1, \2

 

 

 

sed简单用法:

 d: 删除符合条件的行;   
[root@chinadaas109 ~]# cat t
1,2099-12-30
2,2099-12-31
3,2099-02-31
HELLO WORLD
[root@chinadaas109 ~]# sed '1,2d' t
3,2099-02-31
HELLO WORLD

 

 sed替换字符串案例:

 

[root@chinadaas109 zhoumingtest]# sed 's/hello/HELLO/' zm1
HELLO   ---> 源文件为hello
world
say
good	

 

sed练习:

1、删除/etc/grub.conf文件中行首的空白符;
sed -r 's@^[[:spapce:]]+@@g' /etc/grub.conf
2、替换/etc/inittab文件中"id:3:initdefault:"一行中的数字为5;    这里 sed/// 使用 sed@@@来间隔
sed 's@\(id:\)[0-9]\(:initdefault:\)@\15\2@g' /etc/inittab
3、删除/etc/inittab文件中的空白行;
sed '/^$/d' /etc/inittab
4、删除/etc/inittab文件中开头的#号; 
sed 's@^#@@g' /etc/inittab
5、删除某文件中开头的#号及后面的空白字符,但要求#号后面必须有空白字符;
sed -r 's@^#[[:space:]]+@@g' /etc/inittab
6、删除某文件中以空白字符后面跟#类的行中的开头的空白字符及#
sed -r 's@^[[:space:]]+#@@g' /etc/inittab
7、取出一个文件路径的目录名称;
echo "/etc/rc.d/" | sed -r 's@^(/.*/)[^/]+/?@\1@g'	
基名:
echo "/etc/rc.d/" | sed -r 's@^/.*/([^/]+)/?@\1@g'   

 

 

工作中遇到的 sed 源文件下替换字符串写法:

 

source ../../conf.properties

target_dir=data_process_$DATE
current_date=$(date +%Y-%m-%d)
echo $current_date
rm -rf $target_dir > /dev/null 2>&1
mkdir $target_dir

# Generate the ql from the merge_table directory
for ql in `ls merge_table | grep ql`
do
  sed "s/%CHINADAASREDUCETASKS%/$MAPRED_REDUCE_TASKS/g" merge_table/$ql > $target_dir/$ql
  sed -i "s/%CHINDAASDATE%/$DATE/g" $target_dir/$ql
  sed -i "s/%current_date%/$current_date/g" $target_dir/$ql
done

 

 

 

3 awk:

 

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.

awk也是行文本处理方式,将符合PATTERN的行放在内存中处理ACTION 并在显示界面中展示。


简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

 

awk 'PATTERN{ACTION}' file   其中,PATTERN是匹配格式   ACTION是要执行的动作 
eg:
[root@chinadaas12 zmtest]# df -lh | awk '{print $1}'
Filesystem
/dev/sda3
tmpfs
/dev/sda1
[root@chinadaas12 zmtest]# df -lh | awk '{print $1,$3}'
Filesystem Used
/dev/sda3 2.5G
tmpfs 0
/dev/sda1 26M
 

[root@chinadaas12 zmtest]# awk -F: '{print $1,$3}' /etc/passwd    显示指定分隔符为 :
root 0
bin 1
daemon 2
adm 3
lp 4 

 

 

分享到:
评论

相关推荐

    sed-4.2.1.rar包括sed-4.2.1-setup.exe、sed-4.2.1-dep.zip、sed-4.2.1-bin.zip

    `sed` 是“流编辑器”(Stream Editor)的缩写,它是一种功能强大的文本处理工具,广泛应用于Linux和Unix系统中。`sed` 可以读取数据流,对输入的数据进行各种操作,如替换、删除、插入等,并将处理结果输出。在给定...

    Vim-101-hacks、Sed-and-Awk-101-Hacks、Linux-101-hacks 英文版(高清)PDF

    在IT领域,文本编辑器Vim、流处理工具Sed和Awk以及操作系统Linux是三个极其重要的基础工具。这些工具的高效使用对于任何系统管理员、开发者或是IT专业人员来说都是必不可少的技能。以下是对这三个主题的详细解释: ...

    sed and awk 101 hacks.pdf

    Sed和Awk是UNIX和Linux系统中极为重要的流编辑器和文本处理工具,它们能够通过简单的命令或脚本高效处理文本文件,实现复杂的文本转换和报告生成。接下来,我们将根据提供的文件内容详细地说明Sed和Awk的关键知识点...

    sed和awk简明手册

    - sed和awk都是非常强大的文本处理工具,在Linux和Unix系统中广泛使用。 - sed适用于简单的文本替换和编辑任务,而awk更适合处理结构化的数据文件。 - 了解sed和awk的基本语法和常用命令对于日常的文本处理工作非常...

    Sed与awk第二版(高清版).pdf

    根据提供的文件信息,我们可以从《Sed与awk第二版(高清版).pdf》这一资源中提炼出关于Sed和awk这两个强大的文本处理工具的相关知识点。虽然免责声明部分并未提供具体的技术内容,但我们可以通过书籍的标题、描述及...

    Sed与awk_中英文高清版

    《Sed与Awk》是IT领域中关于文本处理的经典之作,主要讲解了两种强大的命令行工具:Sed(流编辑器)和Awk(数据处理语言)。这两款工具在Linux和Unix系统中广泛使用,尤其适用于数据提取、转换、报告生成等任务。 ...

    awk文本处理工具

    awk是一种在Linux/Unix环境下广泛使用的文本处理工具,它是编程语言的一种,能够高效处理文本和数据。在Linux运维中,awk、sed和grep被称为“文本处理三剑客”,尤其在编写Shell脚本自动化任务时发挥着重要作用。awk...

    SED与AWK 高清第三版

    《SED与AWK 高清第三版》是一本专注于Linux系统中强大文本处理工具sed和awk的教程。在Linux环境中,sed和awk是不可或缺的工具,它们能够高效地处理大量文本数据,进行搜索、替换、格式化等操作,极大地提高了运维...

    sed & awk 第二版 例程 源代码 源码 sed & awk sourcecode

    《sed与awk 第二版 例程 源代码》是一部深入探讨文本处理工具sed和awk的经典著作。这本书的核心在于其丰富的例程和源代码,旨在帮助读者掌握这两个强大的命令行工具的用法。sed(流编辑器)和awk(编程语言)在IT...

    Sed与Awk (中文版)

    sed和awk是广泛应用于UNIX系统中的两个文本处理工具。sed是流编辑器(stream editor)的缩写,而awk则是一种编程语言,得名于其三位开发者:Alfred Aho、Peter J. Weinberger和Brian W. Kernighan。 **sed的作用与...

    shell浅谈之七文本处理工具grep、sed、awk.docx

    在Linux世界中,Shell脚本提供了许多强大的工具,其中grep、sed和awk是文本处理的三大利器。它们各自有着独特的用途,但又相互关联。在本文中,我们将深入探讨grep命令,以及它如何帮助理解sed和awk。 grep,全称...

    sed&awk;手册

    在UNIX和Linux操作系统中,`sed`和`awk`是两个强大的文本处理工具,它们能够对文本文件进行高效的处理和分析。这两个工具都是基于命令行的,因此在自动化脚本和批处理任务中非常有用。 **Sed(流编辑器)** `sed`...

    sed&awk;

    其中,`sed`(stream editor)和`awk`是两款非常强大的文本处理工具,它们不仅功能强大而且极其灵活。本文将详细介绍这两款工具的基础知识以及一些高级用法,帮助读者更好地理解和掌握它们。 #### 二、sed简介 ###...

    awk and sed 3

    在IT领域,`awk` 和 `sed` 是两种强大的文本处理工具,广泛应用于Linux和Unix系统。它们在处理大量文本数据、格式转换、数据分析等方面有着卓越的表现。在本压缩包"awk and sed 3"中,包含了一份名为"awk and sed3....

    shell编程-awk,sed,crontab

    - **基本概念**:awk是一种强大的文本分析工具,用于处理和打印数据。它基于模式扫描和处理语言,可以从文件或标准输入中读取数据,按照指定的模式进行操作。 - **工作原理**:awk逐行处理输入,当遇到匹配特定...

    grep,sed,awk命令实例大练习

    在Linux或Unix环境中,`grep`、`sed`和`awk`是三个非常强大的文本处理工具。通过掌握这些工具的基本用法及高级功能,用户可以高效地处理各种文本文件。下面将详细介绍如何使用这些命令进行具体的文本操作。 #### 1....

Global site tag (gtag.js) - Google Analytics