Copy From: http://blog.csdn.net/xgdofull/article/details/5429858
awk提供了许多强大的字符串函数,见下表:
awk内置字符串函数
gsub(r,s) 在整个$0中用s替代r
gsub(r,s,t) 在整个t中用s替代r
index(s,t) 返回s中字符串t的第一位置
length(s) 返回s长度
match(s,r) 测试s是否包含匹配r的字符串
split(s,a,fs) 在fs上将s分成序列a
sprint(fmt,exp) 返回经fmt格式化后的exp
sub(r,s) 用$0中最左边最长的子串代替s
substr(s,p) 返回字符串s中从p开始的后缀部分
substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分 详细说明一下各个函数的使用方法。
gsub函数有点类似于sed查找和替换。它允许替换一个字符串或字符为另一个字符串或字符,并以正则表达式的形式执行。第一个函数作用于记录$0,第二个gsub函数允许指定目标,然而,如果未指定目标,缺省为$0。
index(s,t)函数返回目标字符串s中查询字符串t的首位置。length函数返回字符串s字符
长度。match函数测试字符串s是否包含一个正则表达式r定义的匹配。split使用域分隔符fs将
字符串s划分为指定序列a。sprint函数类似于printf函数(以后涉及),返回基本输出格式fmt的
结果字符串exp。sub(r,s)函数将用s替代$0中最左边最长的子串,该子串被(r)匹配。
sub(s,p)返回字符串s在位置p后的后缀。substr(s,p,n)同上,并指定子串长度为n。
现在看一看awk中这些字符串函数的功能。
1.gsub
要在整个记录中替换一个字符串为另一个,使用正则表达式格式,/目标模式/,替换模式
/。例如改变学生序号4842到4899:
$ awk 'gsub('4842/, 4899) {print $0}' grade.txt
J.Troll 07/99 4899 Brown-3 12 26 26
2.index
查询字符串s中t出现的第一位置。必须用双引号将字符串括起来。例如返回目标字符串
Bunny中ny出现的第一位置,即字符个数。
$ awk 'BEGIN {print index("Bunny", "ny")} grade.txt
4
3.length
返回所需字符串长度,例如检验字符串J.Troll返回名字及其长度,即人名构成的字符个
数。
$ awk '$1=="J.Troll" {print length($1) " "$1}' grade.txt
7 J.Troll
还有一种方法,这里字符串加双引号。
$ awk 'BEGIN {print length("A FEW GOOD MEN")}'
14
4.match
match测试目标字符串是否包含查找字符的一部分。可以对查找部分使用正则表达式,返
回值为成功出现的字符排列数。如果未找到,返回0,第一个例子在ANCD中查找d。因其不
存在,所以返回0。第二个例子在ANCD中查找D。因其存在,所以返回ANCD中D出现的首位
置字符数。第三个例子在学生J.Lulu中查找u。
$ awk '{BEGIN {print match("ANCD", /d/)}'
0
$ awk '{BEGIN {print match("ANCD", /C/)}'
3
$ awk '$1=="J.Lulu" {print match($1, "u")} grade.txt
4
5.split
使用split返回字符串数组元素个数。工作方式如下:如果有一字符串,包含一指定分隔
符-,例如AD2-KP9-JU2-LP-1,将之划分成一个数组。使用split,指定分隔符及数组名。此
例中,命令格式为("AD2-KP9-JU2-LP-1",parts_array,"-"),split然后返回数组下标数,这
里结果为4。
还有一个例子使用不同的分隔符。
$ awk '{BEGIN {print split("123#456#678", myarray, "#")}'
3
这个例子中,split返回数组myarray的下标数。数组myarray取值如下:
Myarray[1]="123"
Myarray[2]="456"
Myarray[3]="789"
6.sub
使用sub发现并替换模式的第一次出现位置。字符串STR包含‘popedpopopill’,执行下
列sub命令sub(/op/,"op",STR)。模式op第一次出现时,进行替换操作,返回结果如下:
‘pOPedpopepill’。
假如grade.txt文件中,学生J.Troll的记录有两个值一样,“目前级别分”与“最高级别分”。只
改变第一个为29,第二个仍为24不动,操作命令为sub(/26/,"29",$0),只替换第一个出现
24的位置。
$ awk '$1=="J.Troll" sub(/26/, "29", $0)' grade.txt
L.Troll 07/99 4842 Brown-3 12 29 26
L.Transley 05/99 4712 Brown-2 12 30 28
7.substr
substr是一个很有用的函数。它按照起始位置及长度返回字符串的一部分。例子如下:
$ awk '$1=="L.Transley" {print substr($1, 1,5)}' grade.txt
L.Tan
上面例子中,指定在域1的第一个字符开始,返回其前面5个字符。
如果给定长度值远大于字符串长度, awk将从起始位置返回所有字符,要抽取L.Tansley的姓,只需从第3个字符开始返回长度为7。可以输入长度99,awk返回结果相同。
$ awk '{$1=="L.Transley" {print substr($1, 3,99)}' grade.txt
Transley
substr的另一种形式是返回字符串后缀或指定位置后面字符。这里需要给出指定字符串及其返回字串的起始位置。例如,从文本文件中抽取姓氏,需操作域1,并从第三个字符开始:
$ awk '{print substr($1, 3)}' grade.txt
Troll
Transley
还有一个例子,在BEGIN部分定义字符串,在END部分返回从第t个字符开始抽取的子串。
$ awk '{BEGIN STR="A FEW GOOD MEN"} END {print substr(STR,7)) grade.txt
GOOD MEN
8.从shell中向awk传入字符串
awk脚本大多只有一行,其中很少是字符串表示的,这一点通过将变量传入awk命令行会变得很容易。现就其基本原理讲述一些例子。
使用管道将字符串stand-by传入awk,返回其长度。
$ echo "Stand-by" | awk '{print length($0)}'
8
设置文件名为一变量,管道输出到awk,返回不带扩展名的文件名。
$ STR="mydoc.txt"
$ echo $STR | awk '{print subst($STR, 1, 5)}'
mydoc
设置文件名为一变量,管道输出到awk,只返回其扩展名。
$ STR="mydoc.txt"
$ echo $STR | awk '{print substr($STR, 7)}'
txt
awk 内置时间函数:
mktime :
2013-08-23 18:39:53 时间转换成s
gsub("[:-]", " ", str);
ts = mktime(str);
strftime:
strftime("%c",tstamp);
systime:
当前秒数,从1970年开始
相关推荐
**六、awk常用函数** 1. **字符串长度**:`length(s)`返回字符串`s`的长度。 2. **字符串截取**:`substr(s,p)`从`s`的第`p`位置开始截取到最后,`substr(s,p,n)`截取`n`个字符。 3. **字符串分割**:`split(s, ...
### AWK基本的一些常用用法 #### AWK简介 AWK是一种强大的文本处理工具,它最初是为了方便地处理结构化数据而设计的。AWK语言不仅支持基础的文本处理功能,还提供了高级的数据处理能力,使得它在数据分析、报告生成...
随着学习的深入,awk还支持更复杂的操作,如条件语句(`if`)、循环(`for`、`while`)以及自定义函数。在后续的文章中,作者会进一步探讨这些高级主题,并展示一个实际的awk演示程序,帮助读者更好地理解和运用awk...
LINUX 的 awk 和 sed 的常用用法 awk 是一种功能强大的文本处理工具,它可以在文件或字符串中基于指定规则浏览和抽取信息。awk 语言的最基本功能是在文件或字符串中基于指定规则浏览和抽取信息。 调用 awk 有三种...
- **用户定义函数**:可以自定义函数以执行特定的操作,这增加了AWK程序的灵活性。 - **使用getline输入文件**:使用`getline`可以从文件中读取一行或多行数据。 #### 八、多行记录处理 - **多行记录**:AWK默认以...
自定义函数的使用进一步提升了awk的灵活性,可以将常用的操作封装成函数,提高代码的复用性和可读性。最后,awk的高级输入输出功能,如重定向、管道和重用外部变量,使得awk能够与其他Unix工具无缝集成,进行更复杂...
本资源"Linux常用命令-常用函数-核心手册-C一站式学习.rar"正是针对Linux初学者和进阶者的一站式学习资料,涵盖了Linux常用命令、C语言编程以及Linux内核相关的知识点。 首先,"Linux常用命令全集.CHM"包含了Linux...
- **gawk**:GNU awk 的实现,是目前最常用且功能最全的 awk 实现之一。 - 不同的系统可能预装了不同的 awk 版本,例如 Solaris 使用 nawk,而 GNU/Linux 系统通常使用 gawk。 ### 二、awk的基本用法 #### 1. awk...
对于 Solaris 操作系统而言,推荐使用 **nawk**,因为它相比旧版的 awk 增加了许多重要的功能,如支持数学运算中的幂运算 `^`、函数 `getline` 和 `system` 等。 #### 三、awk的基本语法及内部变量 **awk** 的基本...
此外,awk也是算法实验中常用的工具之一,它支持多种排序算法,如插入排序、快速排序和堆排序等,并且可以用于实现拓扑排序和文件更新程序。 在awk的学习过程中,一般建议从快速入门开始,逐步掌握其基础语法和结构...
awk命令常用用法整理;加入了自己在平时运用中的实例,比如通过查询数据库生成csv文件或insert语句。将markdown文件转换成了html文件。 awk有许多强大的字符串函数 gsub(r,s) #在整个$0中,用s代替r gsub(r,s,t) 在...
在学习sed和awk时,了解它们的基本语法和常用命令是首要的。sed的操作主要包括插入、删除、替换、打印等,而awk则需要理解其工作模式(BEGIN、END、模式规则)、字段分隔符、内置变量和函数等概念。通过实际的案例...
- **print**:AWK中最常用的输出函数,用于打印字段或表达式的结果,默认用空格作为字段间的分隔符。 - **Output Separators**:通过设置`OFS`(输出字段分隔符)变量可以改变字段间的分隔符。 - **printf**:...
- awk提供了丰富的内置函数,如数学函数、字符串处理函数等。 #### 三、sed与awk的区别 - **编辑方式**: - sed主要针对文本编辑,主要用于文本替换、删除、插入等操作。 - awk更偏向于数据分析和处理,支持更...
- **版本**:目前 AWK 有多个版本,其中最常用的是 GNU awk(gawk),它提供了更多的特性和扩展性。 #### 四、AWK的工作原理 - **模式匹配**:AWK 使用模式来匹配文本中的行,这些模式可以是简单的字符串或正则...
五、AWK的常用命令和函数 - `print`:打印指定的字段或表达式。 - `printf`:格式化输出,类似于C语言的printf函数。 - `split`:将一个字符串分割成数组。 - `length`:返回字符串或数组的长度。 - `substr`:从...
- **使用printf格式化输出、awk内置数值函数、随机数生成器、常用字符串函数、GAWK/NAWK的字符串函数、处理参数、OFMT、GAWK内置的环境变量、pgawk–awk运行分析器、位操作、用户自定义函数、使输出摆脱语言依赖、...
首先,`awk`有三个主要版本:`awk`、`nawk`和`gawk`,其中`gawk`是GNU Awk,是最常用的版本。`awk`的主要功能是根据用户定义的规则从文本文件中提取和格式化信息。它可以用来处理结构化的或非结构化的数据,如日志...
本资料包“Linux常用命令-常用函数-核心手册-C一站式学习”包含了四份重要的参考文档,帮助你深入理解和掌握Linux操作系统的方方面面。 首先,"Linux常用命令全集.CHM"是学习Linux的基础。Linux命令行是其强大功能...