`

linux awk 内置函数详细介绍

 
阅读更多

这节详细介绍awk内置函数,主要分以下3种类似:算数函数、字符串函数、其它一般函数、时间函数

 

一、算术函数:

以下算术函数执行与 C 语言中名称相同的子例程相同的操作:

函数名

说明

atan2( y, x )

返回 y/x 的反正切。

cos( x )

返回 x 的余弦;x 是弧度。

sin( x )

返回 x 的正弦;x 是弧度。

exp( x )

返回 x 幂函数。

log( x )

返回 x 的自然对数。

sqrt( x )

返回 x 平方根。

int( x )

返回 x 的截断至整数的值。

rand( )

返回任意数字 n,其中 0 <= n < 1

srand( [Expr] )

rand 函数的种子值设置为 Expr 参数的值,或如果省略 Expr 参数则使用某天的时间。返回先前的种子值。

 

举例说明:

[chengmo@centos5 ~]$ awk 'BEGIN{OFMT="%.3f";fs=sin(1);fe=exp(10);fl=log(10);fi=int(3.1415);print fs,fe,fl,fi;}'
0.841 22026.466 2.303 3

 

OFMT 设置输出数据格式是保留3位小数

获得随机数:

[chengmo@centos5 ~]$ awk 'BEGIN{srand();fr=int(100*rand());print fr;}'
78
[chengmo@centos5 ~]$ awk 'BEGIN{srand();fr=int(100*rand());print fr;}'
31
[chengmo@centos5 ~]$ awk 'BEGIN{srand();fr=int(100*rand());print fr;}'

41

 

 

二、字符串函数是:

函数

说明

gsub( Ere, Repl, [ In ] )

除了正则表达式所有具体值被替代这点,它和 sub 函数完全一样地执行,。

sub( Ere, Repl, [ In ] )

Repl 参数指定的字符串替换 In 参数指定的字符串中的由 Ere 参数指定的扩展正则表达式的第一个具体值。sub 函数返回替换的数量。出现在 Repl 参数指定的字符串中的 &(和符号)由 In 参数指定的与 Ere 参数的指定的扩展正则表达式匹配的字符串替换。如果未指定 In 参数,缺省值是整个记录($0 记录变量)。

index( String1, String2 )

在由 String1 参数指定的字符串(其中有出现 String2 指定的参数)中,返回位置,从 1 开始编号。如果 String2 参数不在 String1 参数中出现,则返回 0(零)。

length [(String)]

返回 String 参数指定的字符串的长度(字符形式)。如果未给出 String 参数,则返回整个记录的长度($0 记录变量)。

blength [(String)]

返回 String 参数指定的字符串的长度(以字节为单位)。如果未给出 String 参数,则返回整个记录的长度($0 记录变量)。

substr( String, M, [ N ] )

返回具有 N 参数指定的字符数量子串。子串从 String 参数指定的字符串取得,其字符以 M 参数指定的位置开始。M 参数指定为将 String 参数中的第一个字符作为编号 1。如果未指定 N 参数,则子串的长度将是 M 参数指定的位置到 String 参数的末尾 的长度。

match( String, Ere )

String 参数指定的字符串(Ere 参数指定的扩展正则表达式出现在其中)中返回位置(字符形式),从 1 开始编号,或如果 Ere 参数不出现,则返回 0(零)。RSTART 特殊变量设置为返回值。RLENGTH 特殊变量设置为匹配的字符串的长度,或如果未找到任何匹配,则设置为 -1(负一)。

split( String, A, [Ere] )

String 参数指定的参数分割为数组元素 A[1], A[2], . . ., A[n],并返回 n 变量的值。此分隔可以通过 Ere 参数指定的扩展正则表达式进行,或用当前字段分隔符(FS 特殊变量)来进行(如果没有给出 Ere 参数)。除非上下文指明特定的元素还应具有一个数字值,否则 A 数组中的元素用字符串值来创建。

tolower( String )

返回 String 参数指定的字符串,字符串中每个大写字符将更改为小写。大写和小写的映射由当前语言环境的 LC_CTYPE 范畴定义。

toupper( String )

返回 String 参数指定的字符串,字符串中每个小写字符将更改为大写。大写和小写的映射由当前语言环境的 LC_CTYPE 范畴定义。

sprintf(Format, Expr, Expr, . . . )

根据 Format 参数指定的 printf 子例程格式字符串来格式化 Expr 参数指定的表达式并返回最后生成的字符串。

Ere都可以是正则表达式

 

gsub,sub使用

[chengmo@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";gsub(/[0-9]+/,"!",info);print info}'   
this is a test!test!

 

info中查找满足正则表达式,/[0-9]+/ ””替换,并且替换后的值,赋值给info 未给info值,默认是$0

 

查找字符串(index使用)

[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print index(info,"test")?"ok":"no found";}'    
ok

未找到,返回0

 

正则表达式匹配查找(match使用)

[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print match(info,/[0-9]+/)?"ok":"no found";}'           
ok

 

截取字符串(substr使用)

[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print substr(info,4,10);}'                         
s is a tes

从第 4个 字符开始,截取10个长度字符串

 

字符串分割(split使用)

[chengmo@centos5 ~]$ awk 'BEGIN{info="this is a test";split(info,tA," ");print length(tA);for(k in tA){print k,tA[k];}}'
4
4 test
1 this
2 is
3 a

 

分割info,动态创建数组tA,这里比较有意思,awk for …in 循环,是一个无序的循环。 并不是从数组下标1…n ,因此使用时候需要注意。

 

格式化字符串输出(sprintf使用)

格式化字符串格式:

其中格式化字符串包括两部分内容: 一部分是正常字符, 这些字符将按原样输出; 另一部分是格式化规定字符, "%"开始, 后跟一个或几个规定字符,用来确定输出内容格式。

 

格式符

说明

%d

十进制有符号整数

%u

十进制无符号整数

%f

浮点数

%s

字符串

%c

单个字符

%p

指针的值

%e

指数形式的浮点数

%x

%X 无符号以十六进制表示的整数

%o

无符号以八进制表示的整数

%g

自动选择合适的表示法

[chengmo@centos5 ~]$ awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2345; printf("%.2f,%.2u,%.2g,%X,%o\n",n1,n2,n3,n1,n1);}'
124.11,18446744073709551615,1.2,7C,174

 

三、一般函数是:

函数

说明

close( Expression )

用同一个带字符串值的 Expression 参数来关闭由 print printf 语句打开的或调用 getline 函数打开的文件或管道。如果文件或管道成功关闭,则返回 0;其它情况下返回非零值。如果打算写一个文件,并稍后在同一个程序中读取文件,则 close 语句是必需的。

system(Command )

执行 Command 参数指定的命令,并返回退出状态。等同于system 子例程。

Expression | getline [ Variable ]

从来自 Expression 参数指定的命令的输出中通过管道传送的流中读取一个输入记录,并将该记录的值指定给 Variable 参数指定的变量。如果当前未打开将 Expression 参数的值作为其命令名称的流,则创建流。创建的流等同于调用popen 子例程,此时 Command 参数取 Expression 参数的值且 Mode 参数设置为一个是 r 的值。只要流保留打开且 Expression 参数求得同一个字符串,则对 getline 函数的每次后续调用读取另一个记录。如果未指定 Variable 参数,则 $0 记录变量和 NF 特殊变量设置为从流读取的记录。

getline [ Variable ] < Expression

Expression 参数指定的文件读取输入的下一个记录,并将 Variable 参数指定的变量设置为该记录的值。只要流保留打开且 Expression 参数对同一个字符串求值,则对 getline 函数的每次后续调用读取另一个记录。如果未指定 Variable 参数,则 $0 记录变量和 NF 特殊变量设置为从流读取的记录。

getline [ Variable ]

Variable 参数指定的变量设置为从当前输入文件读取的下一个输入记录。如果未指定 Variable 参数,则 $0 记录变量设置为该记录的值,还将设置 NFNR FNR 特殊变量。

 

打开外部文件(close用法)

[chengmo@centos5 ~]$ awk 'BEGIN{while("cat /etc/passwd"|getline){print $0;};close("/etc/passwd");}'
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin

 

逐行读取外部文件(getline使用方法)

[chengmo@centos5 ~]$ awk 'BEGIN{while(getline < "/etc/passwd"){print $0;};close("/etc/passwd");}'
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin

 

[chengmo@centos5 ~]$ awk 'BEGIN{print "Enter your name:";getline name;print name;}'
Enter your name:
chengmo
chengmo

  

调用外部应用程序(system使用方法)

[chengmo@centos5 ~]$ awk 'BEGIN{b=system("ls -al");print b;}'
total 42092
drwxr-xr-x 14 chengmo chengmo     4096 09-30 17:47 .
drwxr-xr-x 95 root   root       4096 10-08 14:01 ..

 

b返回值,是执行结果。

 

 

 

四、时间函数

 

函数名

说明

mktime( YYYY MM DD HH MM SS[ DST])

生成时间格式

strftime([format [, timestamp]])

格式化时间输出,将时间戳转为时间字符串 
具体格式,见下表.

systime()

得到时间戳,返回从197011日开始到当前时间(不计闰年)的整秒数

 

创建指定时间(mktime使用)

[chengmo@centos5 ~]$ awk 'BEGIN{tstamp=mktime("2001 01 01 12 12 12");print strftime("%c",tstamp);}'
2001
0101日 星期一 121212

 

[chengmo@centos5 ~]$ awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=mktime("2001 02 01 0 0 0");print tstamp2-tstamp1;}'
2634468

2个时间段中间时间差,介绍了strftime使用方法

 

[chengmo@centos5 ~]$ awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=systime();print tstamp2-tstamp1;}' 
308201392

 

strftime日期和时间格式说明符

格式

描述

%a

星期几的缩写(Sun)

%A

星期几的完整写法(Sunday)

%b

月名的缩写(Oct)

%B

月名的完整写法(October)

%c

本地日期和时间

%d

十进制日期

%D

日期 08/20/99

%e

日期,如果只有一位会补上一个空格

%H

用十进制表示24小时格式的小时

%I

用十进制表示12小时格式的小时

%j

11日起一年中的第几天

%m

十进制表示的月份

%M

十进制表示的分钟

%p

12小时表示法(AM/PM)

%S

十进制表示的秒

%U

十进制表示的一年中的第几个星期(星期天作为一个星期的开始)

%w

十进制表示的星期几(星期天是0)

%W

十进制表示的一年中的第几个星期(星期一作为一个星期的开始)

%x

重新设置本地日期(08/20/99)

%X

重新设置本地时间(120000)

%y

两位数字表示的年(99)

%Y

当前月份

%Z

时区(PDT)

%%

百分号(%)

 

 

分享到:
评论

相关推荐

    Linux AWK内置函数

    ### Linux AWK内置函数详解 #### 一、算术函数 AWK 提供了一系列内置的数学函数,可以方便地处理各种数学运算。 1. **`atan2(y, x)`** - **功能**:计算 y 和 x 的商的反正切值。 - **示例**:`awk 'BEGIN { ...

    linux awk 内置变量使用介绍.docx

    以下是对标题和描述中提到的`awk`内置变量的详细解释: 1. **$0**:这个变量代表当前记录,即每一行的完整内容。 2. **$1~$n**:这些变量表示当前记录的第n个字段。例如,`$1`是第一个字段,`$2`是第二个字段,...

    Linux实战awk详解

    Linux实战awk详解主要聚焦在如何利用awk这一强大的命令行工具处理文本流问题。Awk是Linux/unix系统中用于处理结构化文本数据的强大工具,它能够解析、处理和格式化文本,尤其在日志分析、数据提取和报表生成等方面...

    linux_awk 学习手册

    awk 的主要功能在于对文本数据进行样式扫描和处理,它能够完成 grep 和 sed 能做的大部分任务,甚至提供了更多的功能,如样式装入、流控制、数学运算、进程控制语句、内置变量和函数等,形成了一个完整的语言体系,...

    linux awk 命令大全

    如果要计算所有行的平均长度,可以使用`awk`的内置变量和函数: ```bash awk '{sum += length($0); count++} END {print "Average length:", sum/count}' input_file ``` `awk`的强大之处在于它结合了模式匹配和...

    Unix_Awk手册

    Awk 是一种强大的文本处理工具,尤其适用于 Unix/Linux 环境下的文本模式扫描和数据处理任务。通过灵活运用不同的调用方式,可以极大地提高工作效率,解决各种文本处理需求。无论是简单的命令行应用,还是复杂的程序...

    linux-shell脚本命令:awk命令简介

    awk内置函数还包括对字符串进行操作的功能,例如 substr、split、sub和gsub函数,分别用于获取子字符串、分割字符串到数组、字符串替换等。 使用awk时,模式匹配是一个非常重要的功能。模式可以是字符串或者正则...

    linux awk学习

    通过以上介绍可以看出,Awk 是一个功能强大的文本处理工具,它提供了丰富的语法结构和操作符,能够满足大多数文本处理的需求。掌握 Awk 的使用对于 Linux 系统管理员来说是一项非常有用的技能。

    linux-awklinux-awk

    Awk 提供了许多内置函数,如 `length()`, `split()`, `index()`, `tolower()`, `toupper()` 等。 #### 15. How-to 这里提供了 Awk 的一些常见用途和示例,涵盖了 Awk 的基本使用方法和技巧,适合初学者快速上手。 ...

    Linux AWK 命令

    4. **函数**:AWK支持内置函数和用户自定义函数,如`length()`用于获取字符串长度。 **示例应用** 1. **提取数据**:通过模式匹配提取特定字段,例如`awk '/pattern/ {print $1}' file`。 2. **计数统计**:可以...

    linux awk学习笔记

    - **内置函数**:提供了一些内置函数,如`length()`、`print()`、`substr()`等。 ### 11. How-to `awk`的学习需要结合实际案例进行,通过编写和运行脚本来熟悉其用法和功能。 总结,`awk`是Linux文本处理的重要...

    Linux/Unix AWK详细用法中文图解

    AWK内置了许多有用的函数,如字符串函数`length()`, `index()`, `split()`,数学函数`sqrt()`, `int()`等。此外,还可以自定义函数以增强程序功能。 七、输入输出操作 1. `print`和`printf`用于输出,`print`自动...

    linux目录下的awk讲解

    本篇文章将深入探讨awk的使用,包括调用方式、正则表达式、内置变量、操作符以及字符串和格式化函数。 首先,让我们了解如何调用awk。基本语法通常是`awk '程序' 文件`,其中'程序'是awk命令和规则的集合,文件是要...

    linux awk 操作日指南

    ### Linux Awk 操作日指南知识点详解 #### Awk简介及背景 - **定义与特点**:Awk 是一种专为文本处理而设计的编程语言,具有强大的模式扫描与处理能力。它支持复杂的条件判断、循环等结构化的编程概念,并且能够...

    Linux awk 快速掌握 超牛中文思维导图

    AWK 提供了极其强大的功能:可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。它具备了一个完整的语言所应具有的几乎所有精美特性。实际上 AWK 的确拥有自己的语言:AWK 程序设计语言, ...

    AWK AWK 详细使用文档

    - **内置函数库**:AWK提供了一系列内置函数,用于处理数学运算、字符串操作等。 - **常见函数**:如`sqrt()`用于计算平方根,`toupper()`用于转换字符串为大写等。 #### 十五、内置变量 - **内置变量**:AWK定义...

    linuxawk完全手册.pdf

    Awk 是一种强大的文本分析工具,由 Aho、Weinberg 和 Kernighan 三位开发者命名,它不仅具备样式扫描和处理的能力,还能执行复杂的文本处理任务,甚至包含内置的变量和函数,形成了自己的编程语言——awk 程序设计...

    linux中shell脚本中awk的深入分析

    本文档将深入分析 awk 的使用和实现机制,探讨 awk 的内置变量、指令和函数,并通过实践示例加深理解。 awk 的内置变量 awk 提供了多种内置变量,用于存储和处理数据。这些变量包括: * ARGC:命令行参数个数 * ...

Global site tag (gtag.js) - Google Analytics