1.元字符是一些在正则表达式中有着特殊含义的字符。
也就是说这些字符是无法代表它们本身的,如果想表式它们本身就必须经过转义。
任何一个元字符都可以通过给他加上
反斜杠字符(\)作为前缀的办法来转义。
举例:
在需要匹配
\本身的时候,我们必须把它转义为
\\
2.匹配空白字符
元字符分两种:
(1)一种用于匹配文本的(比如‘.’)
(2)另一种用于正则表达式的语法所要求的(比如‘[’和‘]’)
[\b] 回退一个字符
\f 换页符
\n 换行符
\r 回车符
\t 制表符
\v 垂直制表符
3、匹配特定的字符类别
一些常用的字符集合可以使用特殊字符来代替
(1)匹配数字(与非数字)
\d 相当于[0-9],匹配任何一个数字
\D 相当于[^0-9],匹配任何一个非数字
(2)匹配字母和数字(与非字母和数字)
\w 相当于[A-Za-z0-9_],匹配任何一个字母数字字符或下划线字符
\W 相当于[^A-Za-z0-9_],匹配任何一个非字母数字字符或非下划线字符
(3)匹配空白字符(与非空白字符)
\s 相当于[\f\n\r\t\v],匹配任何一个空白字符
\S 相当于[^\f\n\r\t\v],匹配任何一个非空白字符
4、元字符分为”贪婪型“与”懒惰型“两种
贪婪型:
当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符
考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。
懒惰型:
我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:
a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)。
eg:
文本:
This offer is not availiable to customers
living in <B>AK</B> and <B>HI</B>.
or <B></B> or <b>ak</B>
正则:
<Bb>.*</Bb>
匹配结果:(贪婪型)注意看颜色表示匹配程度。
正则:
<Bb>.*?</Bb>
匹配结果:(懒惰型)
懒惰限定符
代码 / 语法说明
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
5、常用元字符表
代码 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
常用的反义代码
代码/语法 说明
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou]匹配除了aeiou这几个字母以外的任意字符
分享到:
相关推荐
这是编译原理的一个实验, 是把一个正则表达式转化为不确定有穷自动机NFA的算法程序,朋兴趣的朋友可以下载来看看哦.<br> 一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式...
4. **特殊字符与元字符**:正则表达式中有一些特殊字符,如`.`代表任意字符,`\d`代表数字,`\w`代表单词字符(字母、数字或下划线),`\s`代表空白字符。元字符需要使用反斜杠(\)进行转义,如`\.`表示匹配实际的...
<br> 正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。<br><br>3.1 普通字符 <br> 由所有那些未显式...
正则表达式的语法由一系列用于描述字符串模式的字符和元字符组成。 ### 需求分析 根据题目描述,我们需要构建一个正则表达式来匹配一段字符串,该字符串除了允许出现特定字符(例如下划线 `_`)之外,不允许包含...
- 数据验证:在表单提交时,可以使用正则表达式验证输入格式,如邮箱、电话号码等。 - 文件搜索:在代码编辑器中,使用正则表达式快速查找和替换特定模式的文本。 - 数据清洗:在数据预处理阶段,正则表达式可以...
在正则表达式中,元字符表示在正则表达式中不代表其字面含义,而是具有特别意义的字符。例如句点(.)、中括号字符([])、反斜线(\)等都是元字符。为了使用元字符的字面意思,需要进行转义,例如使用反斜线(\)...
正则表达式是由特殊字符(元字符)和普通字符组成的字符串,它们定义了一种模式,用于匹配一系列相似的字符串。在Qt中,我们可以使用`QRegularExpression`类来处理正则表达式。这个类提供了构造、匹配和替换等方法,...
可以使用特殊字符序列来代表某些不可显示字符:<<\t>>代表 Tab(0x09)<<\r>>代表回车符(0x0D)<<\n>>代表换行符(0x0A)要注意的是 Windows 中文本文件使用“\r\n”来结束一行而 Unix 使用“\n”。 正则表达式引擎的...
- **元字符**:如 `.`(任意单个字符)、`*`(零个或多个前面的字符)、`+`(一个或多个前面的字符)、`?`(零个或一个前面的字符)等,用于表示不同类型的匹配规则。 - **分组与捕获**:使用圆括号 `( )` 来分组...
- 基本元字符:如`.`(匹配任意字符,除换行符)、`^`(匹配行首)、`$`(匹配行尾)、`\d`(匹配数字)、`\w`(匹配字母数字下划线)等。 - 量词:`*`(零个或多个)、`+`(一个或多个)、`?`(零个或一个)、`{n...
例如,在`<script language='vbscript'></script>`中,使用非贪婪匹配的正则表达式可以确保正确提取出`vbscript`作为`language`属性的值。 ### 结论 递归匹配和非贪婪匹配都是正则表达式中非常重要的特性。递归...
- `<group>`定义了分组,使用圆括号`()`将一个正则表达式分组起来。 - 例如:`(a|b)c`表示匹配`ac`或`bc`。 ##### 2.10 `<any>` - 任意字符 ``` <any>::="." ``` **解释:** - `<any>`定义了任意字符匹配。 - `.`...
在本教程中,我们将深入探讨如何使用正则表达式来拆分字符串,这对于数据处理和文本分析尤其有用。下面将详细阐述正则表达式的概念、语法以及如何在不同编程语言中实现字符串的拆分。 1. 正则表达式基础 - **模式...
正则表达式(Deelx版)是一种强大的文本处理工具,它允许程序员和用户通过预定义的模式来匹配、查找、替换或者分析字符串。Deelx版是专门为提高正则表达式性能和功能而设计的一个支持库,适用于各种编程语言和应用场景...
VB 正则表达式使用详解 VB 正则表达式是指使用正则表达式在 VB 中进行字符串处理和搜索操作。...了解正则表达式的语法规则和元字符的使用,可以帮助 VB 开发人员更好地使用正则表达式,提高字符串处理的效率和灵活性。
Java正则表达式遵循Perl5的语法,包括元字符(如`.`, `^`, `$`, `*`, `+`, `?`, `{}`, `[]`, `\`, `|`, `(`, `)`)、预定义字符类(如`\d`, `\w`, `\s`)以及量词(如`*`, `+`, `?`, `{n}`, `{n,}`, `{n,m}`)等。 *...
以上给出的正则表达式仅覆盖了一些基础用例,实际的正则表达式可以变得极其复杂,涉及更多的元字符和修饰符,如贪婪与非贪婪匹配、分组、零宽断言等。正则表达式的学习和掌握需要时间和实践,但一旦熟悉,它们将成为...
正则表达式的学习需要对元字符、量词、预查、后向引用等概念有深入理解,同时掌握Java中`Pattern`和`Matcher`的使用方法,结合实际案例进行实践,才能灵活运用到实际项目中。在处理字符串相关问题时,熟练掌握正则...
元字符提供算法来确定 Oracle 如何处理组成一个正则表达式的字符。常见的元字符有: * `.` 匹配一个正规表达式中的任意字符(除了换行符) * `^` 使表达式定位至一行的开头 * `$` 使表达式定位至一行的末尾 * `*` ...