`

grep和正则表达式

 
阅读更多

grep和正则表达式

正则表达式示例表
字 符 意 义 示 例
* 任意长度的字符串。 a* 表示: 空字符串、aaaa、a…
? 长度为0或者1的字符串。 a? 表示: 空字符串和a。
+ 长度为一个或者多个的字符串。 a+表示:a、aa、aaaaaa…
. 任意字符。 a. 表示:a后跟任意字符。
{} 代表上一规则重复数目、
{1,1,s}包含一组匹配花括号,里面有两个数字和一个字符,表示在指定次数范围内找到字符。 a{3}表示:三个a、
a{1,3}表示:一个到三个a、
a{3,} 表示:大于等于三个a、
{3,7,a}表示在3到7次重复范围内匹配字符a。
[] 集合,代表方括号中任意一个字符。 [ab] 表示:a或者b都可以、
[a-z] 表示:从a到z的字符。
() 组,代表一组字符。 (ab){2}表示:abab。
a/b 同时满足。 a/b表示:字符串a后跟字符串b才能满足要求。
a|b 并列,代表符合a或者符合b都可以 a|b表示: 字符串a或者字符串b都满足要求。
^ 如果放在开头表示代表该规则必须在字符串的开头,其他位置代表字符本身。
如果放在[]中的开头表示对该集合取反,其他位置代表字符本身。 ^a表示:a必须在字符串的开头、
[^a]表示:除了a以外的其他字符。
$ 如果放在最后表示该规则必须放在最后,其他位置代表字符本身。 a$表示:a必须在字符串最后。
\:s 正则表达式用 \:s 表示空格。 a\:sb 匹配 a b。
\:a 正则表达式用 \:a 表示字符与数字。 a\:a 匹配 ab、a6 等。
\:c 正则表达式用 \:c 仅表示字符。 a\:c 匹配 ac等,不匹配a1等。
\:p 正则表达式用 \:p 表示可打印字符。
\:D 正则表达式用 \:d 仅表示数字。 a\:c 匹配 a1等,不匹配ac等。
\:x00 正则表达式用 \:x00 表示ASCII字符。
\:r 正则表达式用 \:r 表示回车。
\:N 正则表达式用 \:d 表示换行。

 

一 正则表达式
基本元字符集及其含义
    ^     只只匹配行首
    $     只只匹配行尾
    *     只一个单字符后紧跟*,匹配0个或多个此单字符
    [ ]   只匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用-
            表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
    \     只用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有
           特殊含义。\可以使其失去应有意义
    .     只匹配任意单字符
pattern\      只用来匹配前面pattern出现次数。n为次数
pattern\m    只含义同上,但次数最少为n
pattern\    只含义同上,但pattern出现次数在n与m之间

二 grep 的用法
1 双引号引用
   在grep命令中输入字符串参数时,最好将其用双引号括起来
2 grep选项
   常用的grep选项有:
   -c 只输出匹配行的计数。
   -i 不区分大小写(只适用于单字符)。
   -h 查询多文件时不显示文件名。
   -l 查询多文件时只输出包含匹配字符的文件名。
   -n 显示匹配行及行号。
   -s 不显示不存在或无匹配文本的错误信息。
   -v 显示不包含匹配文本的所有行。

 -o Print each match, but only the match, not the entire line.


3 精确匹配
    使用grep抽取精确匹配的一种更有效方式是在抽取字符串后加\>。假定现在精确抽取48,则为"48\>"
三 grep和正则表达式
     使用正则表达式时最好用单引号括起来,这样可以防止grep中使用的专有模式与一些shell命令的特殊方式相混淆。
1 模式范围
    假定要抽取代码为484和483的城市位置,上一章中讲到可以使用[ ]来指定字符串范围,这里用48开始,
    以3或4结尾,这样抽出484或483。grep '48[34]' data.f
2 不匹配行首
     如果要抽出记录,使其行首不是48,可以在方括号中使用^记号,表明查询在行首开始。
     grep '^[^48]' data.f
3 匹配任意字符
   如果抽取以L开头,以D结尾的所有代码,可使用下述方法,因为已知代码长度为5个字符:
    grep 'L...D' data.f
4 日期查询
    一个常用的查询模式是日期查询。先查询所有以5开始以1 9 9 6或1 9 9 8结尾的所有记录。使用模式5..199[6,8].这意味着第一个字符为 5,后跟两个点,接着是199,剩余两个数字是6或8。
     grep '5..199[6,8]' data.f
    查询包含1998的所有记录的另外一种方法是使用表达式[0-9]\[8],含义是任意数字重复3次,后跟数字8,虽然这个方法不像上一个方 法那么精确,但也有一定作用。
5 使用grep匹配“与”或者“或”模式
    grep命令加- E参数,这一扩展允许使用扩展模式匹配。例如,要抽取城市代码为2 1 9或2 1 6,方法如下:
    grep -E '219|216' data.f
6 空行
   结合使用^和$可查询空行。使用- n参数显示实际行数:
    grep '^$' data.f
7 grep 与类名的使用
   类等价的正则表达式类等价的正则表达式
[[:upper:]]   [A-Z]               [[:alnum:]] [0-9a-zA-Z]
[[:lower:]]   [a-z]               [[:space:]] 空格或t a b键
[[:digit:]]   [0-9]                [[:alpha:]] [a-zA-Z]

分享到:
评论

相关推荐

    Indesign_GREP正则表达式

    ### Indesign_GREP正则表达式详解 #### 1. GREP正则表达式概述 在Adobe InDesign软件中,GREP(Global Regular Expression Print)正则表达式的使用能够极大地...希望本文能帮助读者更好地理解和运用GREP正则表达式。

    grep、sed、awk、perl等对正则表达式的支持的差别

    在IT领域,文本处理是日常工作中不可或缺的一部分,而grep、sed、awk和perl这四个工具在处理文本时都广泛地使用了正则表达式。它们各自有着不同的特性和适用场景,理解它们之间的差异有助于我们更高效地进行文本操作...

    grep与正则表达式

    ### grep与正则表达式详解 #### 一、引言 `grep` 是一款强大的文本搜索工具,它能够帮助用户快速地在文件中查找符合特定模式的字符串。结合正则表达式,`grep` 可以实现更为复杂精确的文本搜索任务。本文将详细...

    Linux常用命令和管理03-grep及正则表达式1

    正则表达式是一种模式匹配语言,包括基本正则表达式和扩展正则表达式两种。基本正则表达式支持基本元字符,如点号、字符类、重复符号等。扩展正则表达式支持更多的元字符,如分组、引用等。fgrep 命令是 fast grep ...

    csharp正则表达式参考手册

    正则表达式,又称规则表达式。(英语:Regular ...正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成"regex",单数有regexp、regex,复数有regexps、regexes、regexen。

    linux系统shell正则表达式-练习工具和教材

    在Linux Shell环境中,正则表达式常与grep、sed、awk等命令结合使用,以实现高效的数据筛选和处理。 1. 元字符:正则表达式的核心是元字符,它们具有特殊的含义。例如,`.`表示任意单个字符,`^`表示行首,`$`表示...

    正则表达式.txt,正则表达式.txt

    此外,在日常工作中使用的工具如 grep、sed 和 awk 等也支持正则表达式的操作。 #### 三、基本概念介绍 1. **元字符**:正则表达式中的特殊字符,用于构建复杂的匹配规则。 - **`.`**:匹配任何单个字符(除了换...

    文本三剑客之grep及正则表达式 -.pdf

    - **定义**:`grep` 是 Linux 和 Unix 系统中的一种强大的文本搜索工具,它能够使用正则表达式来搜索文本,并将匹配的行打印出来。其全称是 Global Regular Expression Print,意为全局正则表达式版本。 - **功能**...

    精通正则表达式&正则表达式经典实例

    9. **实例应用**:正则表达式广泛应用于文本编辑器(如vim、emacs)、编程语言(如JavaScript、Python、Java)和搜索引擎(如grep、findstr)。例如,用于验证邮箱格式、手机号码、提取URL等。 通过《精通正则...

    正则表达式详细介绍

    在Linux和Unix环境中,正则表达式常用于命令行工具,如grep、sed和awk等。在这些环境中,正则表达式广泛用于文本处理和自动化任务的脚本编写。 综上所述,正则表达式是文本处理中不可或缺的工具。通过理解正则...

    C#字符串和正则表达式参考手册.pdf

    正则表达式的概念最早是由Unix操作系统中的工具软件普及开来的,如sed(流编辑器)和grep(全局搜索正则表达式并打印)。在编程语言中,正则表达式引擎常作为语言内置功能存在,Perl语言就是一个著名的例子,其正则...

    正则表达式之道

    正则表达式,又称规则表达式。(英语:Regular ...正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成"regex",单数有regexp、regex,复数有regexps、regexes、regexen。

    正则表达式(里面包含大量的正则表达式)

    - 在许多文本编辑器和命令行工具(如grep)中也支持正则表达式。 4. **高级特性**: - **非贪婪匹配**:默认情况下,量词是贪婪的,尽可能多的匹配字符。使用 `?` 可使量词变得非贪婪,如 `.*?`。 - **预查**:`...

    unix下的正则表达式

    通过理解其核心概念和元字符的功能,可以高效地在grep、sed、awk等工具中应用正则表达式,从而在日常工作中实现自动化文本分析和处理,节省大量时间和精力。在实践中不断尝试和优化正则表达式,是成为Unix高手的...

Global site tag (gtag.js) - Google Analytics