`

shell脚本regex正则表达式 和 字符串替换

阅读更多

转自:http://hi.baidu.com/yangyangye2008/blog/item/fafb00d54b504211a18bb78c.html

任意字符
^行首匹配
$行尾匹配
^$表示空行,不含字符的行
^ $匹配只有单个空格的行
[0-9]
[a-zA-Z]
^[A- Z]搜索以大写字母开头的行
[^A-Z]匹配大写字母意外的任意字符
*表示匹配0个或若干个字符,如:a*,表示匹配0个或若干个a; aa*表示匹配至少1个a
.*来表示0或若干个任意字符
e.e*表示匹配第一个e和最后一个e之间的任意字符
[-0-9]匹配一 个连字符或数字
[]a-z]匹配一个]或者字母
\{min,max\}匹配任意数目的字符串
[a-z]\{10\}只匹配10个 a-z字符的字符串
s/.\{5\}$// 删除每行的最后5个字符
\(...\),n是1到9的数字,表示存储用的寄存器,用\n来引 用存在寄存器中的内容
^\(.\)\1匹配行首的第一个字符,并将该字符存到1号寄存器中,然后匹配1号寄存器中的内容,这由\1的描述。该正则 表达式的最终效果是,如果一行的头两个字符相同,就匹配他们。
^\(.\).*\1$匹配一行中的头一个字符(^.)跟最后一个字符(\1$)相 同的行。.*匹配中间的所有内容
^\(...\)\(...\)行中头三个字符存在1号寄存器,接着的三个字符存在2号寄存器.
s/\(.*\) \(.*\)/\2 \1/g 交换两个字段

.任何字符
^行首
$行尾
*前导的正则表达式重复0或若干次
[字 符表]字符中的任一字符
a..表示a后的2个字符
^wood表示行首的wood
x$表示行为的x
^INSERT$只包含 字符串INSERT的行
^$不包含任何字符的行
x*表示0或若干个连续的x
xx*表示1或多个连续的x
.*表示0活若干 个字符
w.*s表示以w开始,s结尾的任何字符串
[tT]小写或大写的t

[^字符表]表示任一不在字符表中的字符 [^0-9] [^a-zA-Z]
\{min,max\}表示前导的正则表达式重复只烧min次,至多max次[0-9]\{3,9\}表示3到 9个数字
\(...\)表示将小括号中匹配的字符串存储到下一个寄存器中(1-9),
^\(.\)表示行中第1个字符存到1号寄存器
^\ (.\)\1表示行首恋歌字符,且他们相同

cut -c5 file把file文件中没行的第5个字符析取出来;
用逗号分割的数 值列表,如-c1,13,50把第1,13,50个字符析取出来
cut -c20-50把第20到50之间的字符析取出来

who | cut -c1-8
who | cut -c1-8,18- 析取行中的第1到8个字符(用户名)和第18到行尾的字符(登录时间)

cut -ddchar -ffields file其中,dchar是数据中分割各字段的分割符,fields表示要从文件file中析取出来的字段.
字 段编号从1开始,而且格式跟以前将的用来指定字符位置的数字一样(如-f1、2、8、-f1-3、-f4-)。
cut -d: -f1 /etc/passwd
如果已知字段之间使用制表符分隔的,就可以给cut命令用-f选项而不用-c选项,好多了!还记得吧,这里用不着用-d选 项来指定分割符,因为
cut把制表符默认为分割符。

paste和cut正好相反,它不是把行分离开,而是把多行合并在一起。

paste names numbrs文件names中的每一行都和numbers中的对应行显示在一起,中间用制表符分割。
如果不想用制表符作默认分割, 可以使用-dchars指定分割符
paste -d'+' names addresses numbers
-s选项告诉paste把同 一文件中的行粘贴在一起,而不是从其他文件。如果只指定一个文件名,其效果是把文件中的所有行合并成一行,原来隔行之间用制表符或者有-d选项指定的分割 符分割。

sed是用来编辑数据的程序,意指流编辑器(stream editor)。与ed不同,sed不能用于交互,
-n选 项,然后使用p命令显式指定
sed -n '1,2p' file只显示前2行
sed -n '/Unix/p' file只打印包含Unix的行
删除行
d删除整行文件
sed '1,2d' file删除1和2行
记住sed默认把输入 的所有行写入标准输出,所以生于行的文字,也就是从第3行到结尾,都被写入标准输出。
sed '5d'删除第5行
sed '/[Tt]est/d'删除包含test或Test的行
sed -n '20,25p' test只显示文件test的第20行到第25行
sed '1,10s/unix/UNIX/g' intro报intro前10行中的unix改为UNIX
sed '/jan/s/-1/-5/'将所有包含jan的行中第1个-1改为-5
sed 's/...//' data删除data文件每一行的前3个字符
sed 's/...$//' data删除data文件每一行的最后3个字符
sed -n 'I' text显示文件text的所有行,把所有不可打印字符显示为\nn,制表符显示为\t

过滤器tr用来转换来自标准输入的字 符,tr命令的一般格式为
tr from-chars to-chars

tr e x < intro把所有字母e转换成x
tr命令的输入必须重定向到文件intro,因为tr总是从标准输入获得输入;转换的结果写入标准输出,而原始文 件保持不变。
cut -d: -f1,6 /etc/passwd | tr : '  ' 通过在管道线的最后加上适当的tr命令,就可以把冒号转换成制表符,这样产生的输出更容易看
单引号中括的是制表符(尽管你看不到)。必须将它括在 引号中,以便穿过shell,使tr有机会看到它。
使用\nnn来给tr提供8进制表示的字符
一些ascii字符的八进制值
响 铃     7
退格     10
制表符  11
新行     12
换行     12
换页     14
回 车     15
转义     33

date | tr ' ' '\12'此例中,tr接受date命令的输出,并把所有的空格转换成换行
tr '[a-z]' '[A-Z]' <intro将所有小写转换为大写
-s选项,tr命令中的-s选项用来压缩to-chars中重复的字符,换句话说,如果转换完成后,有 to-chars中的某个字符连续出现多次,则这些连续相同的字符被替换为一个字符。
如下面的命令将冒号转换为制表符,并将多个连续制表符替换为 单个制表符:
tr -s ':' '\11\'
tr -s ' ' ' ' <lotspaces通过-s将多个空格全部压缩为单个空格
-d选项用来删除掉输入流中的字符,其一般格式为
tr -d from-chars任何列在from-chars中的字符都会被从标准输入中删除。下例用tr来删除文件intro中的所有空格:
tr -d ' ' <intro
当然sed 's/ //g' intro也可以得到同样的效果

tr 'X' 'x'      把大X专成小x
tr '()' '{}'    把所有左小括号转换成左大括号,右小括号专成右大括号
tr '[a-z]' '[A-Z]' 把小写转大写
tr '[A-Z]' '[N-ZA-M]' 把A-M字母分别专成N-Z把N-Z转成A-M
tr '     ' ''把所有制表符转换成空格
tr -s ' ' ''把多个空格转换成单个空格
tr -d '\14' 删除所有换页字符(八进制14)
tr -d '[0-9]'删除所有数字

grep '[A-Z]' list list中包含一个大写字母的行
grep '[0-9]' data中包含数字的行
grep '[A-Z]...[0-9]' list list中包含以大写字母开始、数字结尾的5个字符组合的行
grep '\.pic$' filelist filelist中以.pic结尾的行


uniq in_file out_file该格式中,uniq把in_file复制到out_file,处理过程中,去掉其中的重复行。如果不指定第2个参数out_file,结 果就写入标准输出;如果in_file没有指定,那么uniq就成了一个过滤器,从标准输入读取输入。

>或<     重定向,覆盖原有的内容
>>或<<  重定向,想文件末尾追加内容
tee      显示在终端上的内容存储到文件 ls | tee >glx

-d  目录
-e  存在
-f  普通文件
-r  进程可读文件
-s  长度不为0
-w  进程可写文件
-x  可执行
-L  链接文件


$#  传给程序的参数个数,或者执行set命令设置的参数个数
$*  对位置参数等的集中引用
$@  跟$*相似,区别在于当加入双引号后("$@"),集中引用位置参数"$1","$2"...等
$0  正执行的程序名
$$  正执行程序的进程id
$!  最后一个发生后台运行的程序的进程id
$?  最后一个在前台执行的程序的退出状态
$-  当前有效选项标志

`command`符号之间的内容为需要执行的命令
make -C /lib/modules/`uname -r`/build M=`pwd`

使用echo可以显示字符串,但是不能格式化字符串,可以使用printf实现
printf "format" arg1 arg2 ...

ln -s from to 把from链接到to上,所以to是from的符号链接

tree -d只显示目录
tree -L 2显示2级目录

字符串比较
s1  = s2     s1等于s2
s1 != s2     s1不等于s2
s1           s1不为空
-n s1        s1不为空
-z s1        s1为空
整数比较操作
-eq 等于
-ge 大于或等于
-gt 大于
-le 小于或等于
-lt 小于
-ne 不等于

[ "$x1" = 5 ]字符串比较
[ "$x1" -eq 5 ]整数比较

-a  逻辑与操作
-o  逻辑或操作


command1 && command2
则先执行command1,如果返回的退出状态 为0,则执行command2;如果command1返回的退出状态非0,则跳过command2

command1 || command2
和上边的&&差不多,只是,仅仅当command1返回非0时,才执行command2


#!/bin/sh
append2=0
include_lib=1

if [ -f cscope_i ];then
     rm cscope_i
fi

for cscope_file in $*; do 
if [ -f "$cscope_file" ] || [ -d "$cscope_file" ];then
#    if [ $cscope_file = '-a' ];then
#     append2=1
#     continue
#    fi
#
#    if [ $cscope_file = '-n' ];then
#     include_lib=0<F11>
#     continue
#    fi
    if [ "$append2" = "1" ];then
     find $cscope_file -maxdepth 1 -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i
    else
     find $cscope_file  -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i
    fi
else
    if [ $cscope_file = '-a' ];then
     append2=1
    elif [ $cscope_file = '-n' ];then
     include_lib=0
    else
     echo "Error: cannot read file $cscope_file"
    fi
fi
done

if [ -f cscope_i ];then
     if [ "$include_lib" = "1" ];then
         cscope -bi cscope_i
     else
         cscope -bki cscope_i
     fi
     rm cscope_i
fi

分享到:
评论

相关推荐

    linux系统shell正则表达式-练习工具和教材

    正则表达式(Regular Expression,简称RE)是一种模式匹配语言,用于在文本中查找符合特定规则的字符串。在Linux Shell环境中,正则表达式常与grep、sed、awk等命令结合使用,以实现高效的数据筛选和处理。 1. 元...

    Linux命令行与shell脚本编程-正则表达式的应用案例

    总结,Linux命令行和shell脚本结合正则表达式能解决大量文本处理问题,无论是简单的文件搜索,还是复杂的邮件验证,都有其独特的优势。通过不断学习和实践,你将能够更熟练地驾驭这一强大的工具。

    shell正则表达式.txt

    正则表达式(Regular Expression),简称regex或regexp,是一种用于匹配字符串中字符组合的工具。它在多种编程语言和环境中都有应用,如Shell脚本、Perl、Python、Java等。正则表达式允许我们执行复杂的文本处理任务...

    正则表达式袖珍手册

    **正则表达式**(Regular Expression),简称regex或regexp,是一种强大的文本处理工具,它允许开发者通过简单的语句来匹配字符串中的特定模式。这种模式可以是单一的字符,也可以是更复杂的字符组合。正则表达式被...

    Linux shell-正则表达式基础-思维导图-

    在IT领域,尤其是在文本处理、数据提取和自动化脚本编写中,正则表达式(Regular Expression,简称regex)是一项至关重要的技能。Linux shell环境中,正则表达式是进行模式匹配和字符串查找的强大工具。以下是对正则...

    详解Linux--shell脚本之正则表达式

    在Linux系统中,正则表达式常常用于shell脚本中,以便进行文本处理、数据提取、字符串搜索等操作。 一、正则表达式的概念及特点 正则表达式,亦称为“RegEx”或“regex”,它是利用预定义的特殊字符集来构建规则...

    e5:Shell脚本,正则表达式,LaTex

    在信息技术领域,Shell脚本、正则表达式和LaTeX是三个非常重要的概念,它们分别在自动化任务处理、文本匹配与搜索以及高质量文档排版方面发挥着核心作用。 首先,让我们深入了解一下Shell脚本。Shell脚本是Linux或...

    电子书--正则表达式之道

    Shell脚本中的grep、sed和awk命令也离不开正则表达式的支持;而在Linux系统中,无论是文件查找、日志分析还是文本处理,正则表达式都是不可或缺的工具。 本教程《正则表达式之道》可能包含以下内容: 1. **基础...

    正则表达式总结

    正则表达式(Regular Expression),简称regex或regexp,是一种用于匹配字符串中字符组合的强大工具。通过简单的语法,它可以描述出一系列为了执行搜索或替换等操作而需要匹配的字符串。正则表达式在多种编程语言和...

    shell高级学习之正则表达式

    在shell环境中,正则表达式通常用于grep、sed、awk等命令中进行文本匹配和替换。 在基础正则表达式中,我们经常使用纯文本进行匹配。例如,在bash shell中,使用echo命令配合sed或gawk,我们可以匹配并打印包含特定...

    Shell+Regex 复习笔记

    - 方式二使用 `[ ]`,适合做基本的字符串和数字判断。 - 方式三使用 `[[ ]]`,功能更加强大,支持逻辑表达式和正则表达式。 - 方式四使用 `test` 命令,用于测试文件属性。 5. **文件测试命令 (test)**: - `...

    shell模糊匹配与正则详解

    在IT领域,尤其是在Linux系统管理和自动化脚本编写中,Shell模糊匹配和正则表达式是不可或缺的工具。正则表达式是一种强大的文本处理工具,它能够通过特定的语法模式匹配和处理字符串。本文将深入探讨这两种技术的...

    Linux Shell常用技巧

    在 Linux Shell 脚本中,正则表达式(Regular Expression,简称 regex 或 regexp)是一种强大的文本处理工具,可以用来进行复杂的字符串搜索和替换操作。 - **基本正则表达式(Basic Regular Expression, BRE)**:...

    shell脚本1

    - **正则表达式 (Regex)**:在Shell脚本中,正则表达式是一种用于匹配字符串的强大工具。 - **基本正则表达式 (BRE)**:BRE 支持基本的匹配模式,如 `.`、`*` 等。 - **扩展正则表达式 (ERE)**:ERE 是 BRE 的扩展...

    java-git-pre-commit-hook:用于Java Java EE项目的带有正则表达式的简单预提交钩子

    正则表达式是一种强大的文本处理工具,能用于匹配、查找、替换等操作。在这个场景下,可能用于验证源代码中的某些模式,比如检查注释格式、禁止某些不安全的字符串出现,或者确保代码遵循一致的命名规则。 标签为...

    shell编程资料

    在shell编程中,正则表达式常用于文件名匹配、字符串查找替换等场景。学习正则表达式,你需要理解元字符(如星号*,加号+,问号?等)、字符类[]、量词{m,n}、分组()、反向引用以及各种特殊符号的功能。 在实际应用...

    Linux 入门时必学60文件处理个命令

    正则表达式(也称为“regex”或“regexp”)是一个可以描述一类字符串的模式(Pattern)。如果一个字符串可以用某个正则表达式来描述,我们就说这个字符和该正则表达式匹配(Match)。这和 DOS 中用户可以使用通配符...

    文件夹递归查询所有文件夹内容替换目标文本

    `replace`用于精确匹配并替换固定字符串,而`replaceAll`则使用正则表达式进行更复杂的匹配和替换。 至于文件字符串替换,Java提供了多种方法,如使用`java.util.regex.Matcher`和`java.util.regex.Pattern`来实现...

    shell编程笔记.zip_programy5v_shell_shell编程

    此外,了解正则表达式(Regular Expressions,简称regex)可以帮助你在Shell脚本中进行复杂的文本匹配和查找替换操作。这在处理日志文件、查找特定模式或进行数据清洗时特别有用。 错误处理和调试技巧是另一个需要...

Global site tag (gtag.js) - Google Analytics