【转】深入浅出之正则表达式（一）

idealab

浏览: 198860 次
性别:
来自: 成都

最近访客更多访客>>

ganxueyun

silence123

xiaoxiaoHer

ms143014

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

转载文章

正则表达式搜索引擎编程 Perl D语言

引用

本文转自：博客园摩诘作品
本文讲解精细，涉及到了正则表达式的基础/引擎/匹配机制/各种特性以及表达式编写技巧，值得研究。

前言：
       半年前我对正则表达式产生了兴趣，在网上查找过不少资料，看过不少的教程，最后在使用一个正则表达式工具RegexBuddy时发现他的教程写的非常好，可以说是我目前见过最好的正则表达式教程。于是一直想把他翻译过来。这个愿望直到这个五一长假才得以实现，结果就有了这篇文章。关于本文的名字，使用“深入浅出”似乎已经太俗。但是通读原文以后，觉得只有用“深入浅出”才能准确的表达出该教程给我的感受，所以也就不能免俗了。
       本文是Jan Goyvaerts为RegexBuddy写的教程的译文，版权归原作者所有，欢迎转载。但是为了尊重原作者和译者的劳动，请注明出处！谢谢！

1. 什么是正则表达式
   基本说来，正则表达式是一种用来描述一定数量文本的模式。Regex代表Regular              Express。本文将用<<regex>>来表示一段具体的正则表达式。
一段文本就是最基本的模式，简单的匹配相同的文本。

2. 不同的正则表达式引擎
   正则表达式引擎是一种可以处理正则表达式的软件。通常，引擎是更大的应用程序的一部分。在软件世界，不同的正则表达式并不互相兼容。本教程会集中讨论Perl 5 类型的引擎，因为这种引擎是应用最广泛的引擎。同时我们也会提到一些和其他引擎的区别。许多近代的引擎都很类似，但不完全一样。例如.NET正则库，JDK正则包。

3. 文字符号
   最基本的正则表达式由单个文字符号组成。如<<a>>，它将匹配字符串中第一次出现的字符“a”。如对字符串“Jack is a boy”。“J”后的“a”将被匹配。而第二个“a”将不会被匹配。
   正则表达式也可以匹配第二个“a”，这必须是你告诉正则表达式引擎从第一次匹配的地方开始搜索。在文本编辑器中，你可以使用“查找下一个”。在编程语言中，会有一个函数可以使你从前一次匹配的位置开始继续向后搜索。
   类似的，<<cat>>会匹配“About cats and dogs”中的“cat”。这等于是告诉正则表达式引擎，找到一个<<c>>，紧跟一个<<a>>，再跟一个<<t>>。
要注意，正则表达式引擎缺省是大小写敏感的。除非你告诉引擎忽略大小写，否则<<cat>>不会匹配“Cat”。

特殊字符

不可显示字符

4. 正则表达式引擎的内部工作机制

正则导向的引擎总是返回最左边的匹配

5. 字符集

字符集的一些应用

取反字符集

字符集中的元字符

字符集的简写

字符集的重复

6. 使用?*或+ 进行重复

限制性重复

注意贪婪性

深入正则表达式引擎内部
用懒惰性取代贪婪性

· 惰性扩展的一个替代方案

7. 使用“.”匹配几乎任意字符

保守的使用点号“.”

8. 字符串开始和结束的锚定

锚定的应用

使用“^”和“$”作为行的开始和结束锚定

绝对锚定

0
顶

0
踩

分享到：

【转】深入浅出之正则表达式（二） | pkg-config工具， ld.so.conf文件， PKG_C ...

2010-03-05 16:00
浏览 1166
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论