`
wxb880114
  • 浏览: 688309 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

正则表达式学习--检索文本文件:egrep

 
阅读更多
正则表达式类似文本处理工具。

正则表达式包括两个部分一:元字符,即有特殊含义的字符 二:普通文本字符。

文本检索是正则表达式最简单的应用之一。

Egrep元字符讲解:
 
   1 行的起始与结束 脱字符号^   美元符号$
    脱字符号^   美元符号$这两个符号的特殊之处在于它们匹配的是个位置 不是具体的文本。

   2 字符组
     匹配若干字符之一用正则表达式的结构体【...】
     e匹配e [ea]匹配e或a '<H[123456]>'/'<H[1-6]>'/匹配H1,H2,H3...搜索Html文件时会有用
   
    -是个连字符 表示一个范围  【0-9A-Z_!.?】能够匹配一个数字,大写字母,下划线感叹号,点号,问号。
    只有在字符组中-才是连字符,除此之外就是普通的文本字符
   
     排除字符组
   [^...]其中^表示排除
     排除性字符组表示匹配一个未列出的字符

    用点号匹配任意字符
   03[-/.]19[-/.]20 可用03.19.20匹配  注意‘-’需要紧跟着[ 或 ^ 否则容易当连字符 处理。

    多选结构
    匹配任意表达式 | 意思是 或 /OR 我们能够把不同的字表达式组合成一个总的表达式
多选结构可以包括很多字符,但不能超越括号的界限

   gr[ea]y与gr(e|a)y是有很大的不同,一个字符组只能匹配目标文本中的单个字符,而每个多选结构本身就是完整的正则表达式,都可以匹配任意长度的文本。

   忽略大小写
   -i 写在正则表达式之前表示忽略大小写,

    单词分界符
   元字符序列 \< \> 可以使用它们匹配单词分界的位置

    可选项元素
    先看看color 和 colour,匹配时 colou?r解决问题,其中 ?代表可选项 加在一个字符后面,表示允许这个字符出现,但是字符的出现不是匹配成功的必要条件。

    其他量词:重复出现
    + 之前紧邻的元素出现一次或多次;
    × 之前紧邻的元素出现任意次也可不出现

   规定重复次数:区间
   {min,max}容许出现次数的区间
分享到:
评论

相关推荐

    正则表达式

    在Linux环境中,熟悉grep、egrep、sed和awk等工具的使用以及它们所支持的正则表达式类型对于高效地处理文本数据至关重要。通过了解每种类型的正则表达式的特性和限制,用户可以更好地选择合适的工具和技术来解决具体...

    精通正则表达式~~~

    检索文本文件:Egrep. 6 Egrep元字符... 8 行的起始和结束... 8 字符组... 9 用点号匹配任意字符... 11 多选结构... 13 忽略大小写... 14 单词分界符... 15 小结... 16 可选项元素... 17 其他量词:重复...

    正则表达式shell

    grep 命令是使用正则表达式的重要工具,它可以用来检索和/或替换那些符合某个模式的文本内容。语法:grep [-cinvABC] ‘word’ filename -a. 过滤出带有某个关键词的行并输出行号 例如:grep ‘关键词’ filename ...

    正则表达式匹配解析过程探讨分析(正则表达式匹配原理)

    正则表达式的应用非常广泛,无论是在文本处理、数据抓取、信息检索、还是编程语言中的字符串操作等方面都有其身影。 在深入学习正则表达式之前,有必要了解正则表达式引擎的概念。正则表达式引擎是执行正则表达式...

    zhengzebiaodashi.rar_操作系统开发_Unix_Linux_

    本压缩包“zhengzebiaodashi.rar”聚焦于正则表达式,一个在文本处理和数据检索中至关重要的工具,特别是与“egrep(1)”命令的使用相关。 正则表达式(Regular Expression)是一种模式匹配语言,用于描述字符串中的...

    Shell 入门实战到精通

    本文详细介绍了 Shell 编程语⾔、Shell 脚本常⽤命令、Shell 正则表达式、Shell 编程、Shell 变量、Shell 数组、Shell 进阶实战和 Shell 案例实战等知识点,为读者提供了一个系统的 Shell 编程指南。

Global site tag (gtag.js) - Google Analytics