`
wxb880114
  • 浏览: 681880 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

正则表达式学习--检索文本文件:egrep

 
阅读更多
正则表达式类似文本处理工具。

正则表达式包括两个部分一:元字符,即有特殊含义的字符 二:普通文本字符。

文本检索是正则表达式最简单的应用之一。

Egrep元字符讲解:
 
   1 行的起始与结束 脱字符号^   美元符号$
    脱字符号^   美元符号$这两个符号的特殊之处在于它们匹配的是个位置 不是具体的文本。

   2 字符组
     匹配若干字符之一用正则表达式的结构体【...】
     e匹配e [ea]匹配e或a '<H[123456]>'/'<H[1-6]>'/匹配H1,H2,H3...搜索Html文件时会有用
   
    -是个连字符 表示一个范围  【0-9A-Z_!.?】能够匹配一个数字,大写字母,下划线感叹号,点号,问号。
    只有在字符组中-才是连字符,除此之外就是普通的文本字符
   
     排除字符组
   [^...]其中^表示排除
     排除性字符组表示匹配一个未列出的字符

    用点号匹配任意字符
   03[-/.]19[-/.]20 可用03.19.20匹配  注意‘-’需要紧跟着[ 或 ^ 否则容易当连字符 处理。

    多选结构
    匹配任意表达式 | 意思是 或 /OR 我们能够把不同的字表达式组合成一个总的表达式
多选结构可以包括很多字符,但不能超越括号的界限

   gr[ea]y与gr(e|a)y是有很大的不同,一个字符组只能匹配目标文本中的单个字符,而每个多选结构本身就是完整的正则表达式,都可以匹配任意长度的文本。

   忽略大小写
   -i 写在正则表达式之前表示忽略大小写,

    单词分界符
   元字符序列 \< \> 可以使用它们匹配单词分界的位置

    可选项元素
    先看看color 和 colour,匹配时 colou?r解决问题,其中 ?代表可选项 加在一个字符后面,表示允许这个字符出现,但是字符的出现不是匹配成功的必要条件。

    其他量词:重复出现
    + 之前紧邻的元素出现一次或多次;
    × 之前紧邻的元素出现任意次也可不出现

   规定重复次数:区间
   {min,max}容许出现次数的区间
分享到:
评论

相关推荐

    文本三剑客之grep及正则表达式 -.pdf

    ### 文本三剑客之grep及正则表达式 #### 1. grep 命令简介 - **定义**:`grep` 是 Linux 和 Unix 系统中的一种强大的文本搜索工具,它能够使用正则表达式来搜索文本,并将匹配的行打印出来。其全称是 Global ...

    Indesign_GREP正则表达式

    在Adobe InDesign软件中,GREP(Global Regular Expression Print)正则表达式的使用能够极大地提高文档编辑效率,特别是在处理大量文本时。通过精确地查找与替换特定模式的文字,用户可以在几分钟内完成原本可能...

    linux系统shell正则表达式-练习工具和教材

    还可以配合其他命令,如`egrep`(支持扩展正则表达式)、`awk`和`sed`进行更复杂的文本处理。 1. grep命令:基本格式为`grep [选项] 'pattern' file`,选项如 `-i` 忽略大小写,`-v` 反选,`-E` 支持扩展正则表达式...

    regexp正则表达式正则表达式正则表达式

    - **grep/egrep**:Unix/Linux 下的命令行工具,用于在文件中搜索匹配正则表达式的行。 #### 五、正则表达式的高级主题 对于更深入的学习者来说,还可以探索以下高级主题: - **反向引用**:在正则表达式中使用...

    正则表达式

    在Linux环境中,熟悉grep、egrep、sed和awk等工具的使用以及它们所支持的正则表达式类型对于高效地处理文本数据至关重要。通过了解每种类型的正则表达式的特性和限制,用户可以更好地选择合适的工具和技术来解决具体...

    正则表达式学习手册

    ### 正则表达式学习手册知识点详解 #### 一、正则表达式的历史与起源 正则表达式作为一项强大的文本处理技术,其历史可以追溯到20世纪40年代。这项技术最初并非源于计算机科学领域,而是起源于数学与神经生理学的...

    快速完全精通正则表达式

    本书《快速完全精通正则表达式》旨在为读者提供一个全面深入学习正则表达式的平台,无论你是初学者还是有一定经验的程序员,都能从中获益匪浅。通过本书的学习,你将能够掌握如何在各种编程环境中运用正则表达式解决...

    unix下的正则表达式

    1. **grep**:用于搜索文本文件中的模式,支持基本和扩展正则表达式。如`grep "pattern" file`。 2. **sed**:流编辑器,用于过滤和转换文本,常用于替换字符串,也支持正则表达式。如`s/pattern/replacement/g`。 3...

    linux shell正则表达式

    Linux Shell中的正则表达式是文本处理和搜索的关键工具,尤其在使用命令行工具如grep、sed和awk时。它们允许我们以灵活的方式查找、替换和解析文本模式。以下是正则表达式的基本概念、分类以及在Linux常用文本工具中...

    正则表达式大全.doc

    正则表达式可以用于在一个文件或字符里查找和替代文本。它具有两种标准:基本的正则表达式(BRE)和扩展的正则表达式(ERE)。ERE 包括 BRE 功能和另外其它的概念。 正则表达式在多种平台上都有应用,包括 Unix ...

    Linux在合集中使用正则表达式来匹配查找.zip

    在Linux系统中,正则表达式(Regular Expression)是一种强大的文本处理工具,它能用于匹配、查找、替换等操作,广泛应用于数据提取、文件搜索、脚本编程等多个领域。本合集主要围绕如何在Linux环境下利用正则表达式...

    精通正则表达式_第三版

    通过以上内容可以看出,《精通正则表达式》这本书覆盖了正则表达式的各个方面,不仅包括理论知识,还有大量的实践案例,非常适合希望深入学习正则表达式的读者。无论是对于初学者还是有一定基础的开发人员来说,这...

    Linux中几个正则表达式的用法.doc

    在Linux系统中,正则表达式(Regular Expression)是一种强大的文本处理工具,它能通过预定义的模式匹配和处理文本数据。以下将详细介绍文件标题和描述中涉及的几个Linux正则表达式用法: 1. **查找IPv4地址**: ...

    正则表达式总结

    - **egrep**:grep的一个变体,支持更多的正则表达式特性。 - **扩展正则表达式符号**: - `+`:匹配前面的字符出现一次或多次。 - `go+d`:匹配以"g"开头、后面跟着一个或多个"o",最后以"d"结尾的字符串。 - `?...

Global site tag (gtag.js) - Google Analytics