`

正则表达式语法

    博客分类:
  • java
阅读更多


 

语法

表达式说明

.

任何单个字符,用作换行符 (\n) 以外的任何单个打印或非打印字符的通配符。

例如,正则表达式 c.t 可匹配 cat、c t、cot 等字符串,但不能匹配 cost。在本例中,句号 (.) 是一个代表单个字符的通配符。它出现在字母“c”和“t”之间,因此字符“c”和“t”之间的任何单个字符都与表达式匹配 - 即使是空格也一样。

*

零或更多,用于匹配在此表达式之前出现零次或更多次的某个字符,可与尽可能多的字符相匹配。

正则表达式 .* 用于匹配某个出现零次或更多次的字符。

例如,正则表达式 b.*k 可匹配 book、back、black、blank 和 buck。在本例中,将句号 (.) 和星号 (*) 组合成一个语法。句号 (.) 紧挨在星号 (*) 表达式之前。星号 (*) 可匹配“b”和“k”之间任意出现零次或更多次的字符。句号 (.) 用作“b”和“k”之间字符的通配符。在本例中,它表示“b”和“k”之间的任意字符都可以反复出现。

+

一或更多,用于匹配在此表达式之前出现一次或更多次的某个字符,可与尽可能多的字符相匹配。

正则表达式 .+ 用于匹配某个出现一次或更多次的字符。

例如,正则表达式 bo+. 可匹配 bob、book 和 boot。在本例中,将句号 (.) 和加号 (+) 组合成一个语法。句号 (.) 紧挨在加号 (+) 表达式之后。加号 (+) 可与出现一次或更多次的字母“o”相匹配。句号 (.) 用作每个单词的最后一个字符的通配符。在本例中,该字符为“b”、“k”和“t”。

@

最小为零或更多,用于匹配在此表达式之前出现零次或更多次的某个字符,可与尽可能少的字符相匹配。

正则表达式 .@ 用于匹配某个出现零次或更多次的字符。

例如,正则表达式 a.@x 可匹配“abxbxb”中的“abx”和“acxcxc”中的“acx”。在本例中,将句号 (.) 和 @ 符号组合成一个语法。句号 (.) 紧挨在 @ 符号表达式之前。@ 符号可与“a”和“x”之间出现零次或更多次的任意字符相匹配。在本例中,句号 (.) 用作字符“a”和“x”之间的字符“b”和“c”的通配符。

#

最小为一或更多,用于匹配在此表达式之前出现一次或更多次的某个字符,可与尽可能少的字符相匹配。

例如,正则表达式 si.#er 可匹配“sicker”或“silkier”。在本例中,将句号 (.) 和井号 (#) 组合成一个语法。句号 (.) 紧挨在井号 (#) 表达式之前。井号 (#) 可与“si”和“er”之间出现一次或更多次的任意字符相匹配。句号 (.) 用作单词 sicker 中字符“c”和“k”的通配符,以及单词 silkier 中“l”、“k”和“i”的通配符。

[ ]

任何一个属于该集合的字符,用于匹配括号 ([ ]) 内的任意一个字符。可以使用连字符 (-) 指定字符的范围,例如 [a-z]。

例如:

  • 正则表达式 c[aou]t 可以匹配 cat、cot 和 cut,但不能匹配 cet 或 cit。

  • 正则表达式 [0-9] 表示匹配任意一个数字。也可以指定多个字母范围。

  • 正则表达式 [A-Za-z] 表示匹配所有大写和小写字母。

^

行首,定位于行首匹配。

例如,正则表达式 ^When in 匹配以“When in”开头且出现于行首的任意字符串,例如“When in the course of human events”或“When in town, call me”。然而,此正则表达式不匹配出现于行首的“What and when in the course of human events”。

$

行尾,定位于行尾匹配。

例如,正则表达式 professional$ 可匹配字符串“He is a professional”,但不能匹配字符串“They are a group of professionals”。

^^

文件开头,定位于文件开头匹配。仅适用于在源代码或文本文件中搜索文本。

例如,若要匹配文件开头的第一个 HTML 标记,可使用此正则表达式:^^

$$

文件末尾,定位于文件末尾匹配。仅适用于在源代码或文本文件中搜索文本。

例如,若要匹配文件末尾的最后一个 HTML 标记(标记后没有空格),可使用此正则表达式:$$

|

或,表示在两项之间进行选择,即匹配“或”符号 (|) 前面或后面的表达式。

例如,正则表达式 (him|her) 匹配下列各项:“it belongs to him”或者“it belongs to her”但不匹配行“it belongs to them”。

\

转义特殊字符,用于匹配反斜线 (\) 后面的字符。这样,就可以查找正则表达式语法中使用的字符(如左大括号 ({) 或脱字号 (^))或其他一些特殊字符。

例如,使用 \$ 可匹配美元符号 ($) 字符,而不是执行用于“定位于行尾”的正则表达式。同样,使用 \. 可匹配句号 (.) 字符,而不是像句号 (.) 正则表达式一样匹配任意一个字符。

{}

标记表达式,对与括号内表达式匹配的文本加标记。可以使用 \N 在“查找”表达式中匹配出现在另一处的标记文本或者将标记文本插入“替换”表达式。

例如,假设要查找连续出现两次的单词。若要搜索,请使用此表达式:{.#} \1

假设连续出现的单词由一个空格隔开,则需要在右大括号 (}) 与反斜线 (\) 之间添加一个空格。

在本例中,将井号 (#)、句号 (.) 和大括号 ({}) 组合成一个语法。在此表达式中,.# 表示任何连续的字符。因为这部分表达式位于大括号 ({}) 内,所以连续的字符将被加上标记,并被引用为 \1。此表达式将查找后跟空格以及字符与其完全相同的任意连续字符。

\N

在“查找”表达式中第 N 个标记表达式中,\N 匹配由第 N 个标记表达式指定的文本,其中 N 是 1 到 9 的数字。

在“替换”表达式中,\N 插入由第 N 个标记表达式匹配的文本,其中 N 是 1 到 9 之间的数字。\0 插入整个“查找”表达式指定的文本。

例如,假设要查找连续出现两次的单词,并使用一个单词替换它们。若要搜索,请使用此表达式:.#} \l

假设连续出现的单词由一个空格隔开,则需要在右大括号 (}) 与反斜线 (\) 之间添加一个空格。在本例中,将井号 (#)、句号 (.) 和大括号 ({}) 组合成一个语法。

若要替换,请使用下列表达式:\l

\1 表示在查找字符串中的第一对大括号内找到的内容。通过在替换操作中使用 \1,实际上是将连续出现两次的单词替换为一个单词。

( )

组表达式,标记子表达式的开始和结束。

子表达式指括在 ( ) 中的正则表达式,例如表达式:(ha)+。在本例中,将加号 (+) 与括号 ( ) 组表达式组合成一个语法。子表达式是 (ha),因为它括在括号 ( ) 内。添加加号 (+) 后,该表达式可查找重复的字母对。加号 (+) 表示“ha”出现一次或更多次。

此表达式可匹配下列各项:“haha”和“hahaha”。

~x

防止匹配,当 x 出现在表达式中的此位置时会防止匹配。

例如,正则表达式 real~(ity) 可匹配“realty”和“really”中的“real”,但不能匹配“reality”中的“real”。

\n

换行符,匹配“代码”视图中的新行,或“设计”视图中的 <br>。

语法 (\n) 是匹配所有换行符的简便方法。

\t

制表符,匹配单个制表符。

例如,如果要查找所有位于行首的制表符,可使用此正则表达式:

^\t+

在本例中,将脱字号 (^)、加号 (+) 和制表符 (\t) 组合成一个语法。脱字号 (^) 位于单个制表符表达式之前,用于匹配位于行首的所有制表符。加号 (+) 表示匹配一个或多个制表符。

[^]

任何一个不属于该集合的字符,用于匹配不包含在脱字号 (^) 之后的字符集内的任何字符。

例如,若要匹配范围之外的任何字符,可使用脱字号 (^) 作为左括号后面的第一个字符。表达式 [^269A-Z] 匹配除 2、6、9 以及任何大写字母之外的所有字符。

n

重复表达式,与脱字号 (^) 之前出现 n 次的表达式相匹配。

例如,若 n 为 4,表达式 [0-9]^4 匹配任何 4 位数序列。在本例中,将字符集 ([ ]) 语法与重复 (^n) 语法组合,以展示正则表达式的更实用的方法。

:a

字母数字字符,用于匹配表达式 [a-zA-Z0-9]。

可以使用表达式 [a-zA-Z0-9] 匹配出现一次的字母(大写或小写)或数字。也称为“字母数字匹配项”。可使用简写表达式 :a 来代替 [a-zA-Z0-9]。

:b

空格,用于匹配代码或文本中的任何空格。

例如,若要匹配行首的单个空格字符,可使用此正则表达式:^:b

:c

字母字符,用于匹配表达式 [a-zA-Z]。使用此表达式可匹配所有大写或小写字母。

可以使用简写表达式 :c 来代替所有 [a-zA-Z]。

:d

数字,用于匹配表达式 [0-9]。此表达式可匹配任何数字。

例如,假设要在文本文件中查找美国的社会福利号。美国的社会福利号的格式为 999-99-9999。:d^3-:d^2-:d^4 或 [0-9]^3-[0-9]^2-[0-9]^4(使用 [0-9] 表示)可返回相同的结果。

可使用简写表达式 :d 来代替所有 [0-9]。

:h

十六进制数字,用于匹配表达式 [0-9a-fA-F]+

使用此表达式可匹配由“A”和“F”之间的大写或小写字母和任意数字组成的十六进制数。

例如,假设网站中的网页使用了多种不同的背景色,而您要将这些网页的颜色改为黑色(即 000000)。但是,您不知道现有颜色的十六进制值。使用此正则表达式可查找所有的现有十六进制值:

\#:h

可以使用 [0-9a-fA-F] 进行搜索,但在本例中,将反斜线 (\)、井号 (#) 和十六进制数字 (:h) 语法组合在一起。\# 匹配非表达式的井号 (#),而 :h 匹配任何十六进制字符序列。

若要替换现有十六进制数值,可键入所需背景颜色的十六进制数值: 000000

:i

标识符,用于匹配表达式 [a-zA-Z_$][a-zA-Z0-9_$]*

处理代码时,如果需要匹配所有程序标识符,可使用简写表达式 :i,而无需键入上述冗长的表达式。

:n

有理数,用于匹配表达式 ([0-9]+\.[0-9]*)|([0-9]*\.[0-9]+)|([0-9]+)

如果需要匹配带小数点的整个数值,可使用简写表达式 :n,而无需键入上述冗长的表达式。

:q

带引号的字符串,用于匹配表达式 ("[~"]*")|('[~']*')

如果需要匹配加引号的所有引号,可使用简写表达式 :q,而无需键入上述冗长的表达式。

:w

字母字符串,用于匹配表达式 [a-zA-Z]+

此语法是一种可匹配一个或多个大写或小写字母字符的简便方法。

:z

整数,用于匹配表达式 [0-9]+

此语法是一种可匹配任何整数的简便方法。

  • 大小: 194.2 KB
分享到:
评论

相关推荐

    C#正则表达式语法大全

    C#正则表达式语法大全涵盖了在C#编程语言中使用正则表达式进行文本匹配、提取、替换等操作所必需的语法知识。正则表达式是一种强大的文本处理工具,它可以描述字符串的模式,让我们能够执行复杂的搜索和匹配操作。 ...

    正则表达式语法大全_手册.doc

    正则表达式语法大全 正则表达式是一种强大的模式匹配语言,广泛应用于字符串处理、文本匹配和搜索等领域。下面是正则表达式语法大全的知识点总结: 1. 特殊字符:在正则表达式中,某些字符具有特殊意义,例如: *...

    正则表达式语法(入门与实例)

    ### 正则表达式语法(入门与实例) #### 一、正则表达式的创建 正则表达式是一种用于模式匹配的强大工具,在JavaScript中可以通过两种方式创建: 1. **字面量方式**: ```javascript var reg = /pattern/; ```...

    正则表达式语法.pdf

    ### 正则表达式语法详解 #### 一、引言 正则表达式是一种强大的文本模式匹配工具,广泛应用于各种编程语言中,用于文本搜索、替换等操作。它结合了普通字符和特殊字符(元字符),能够精确地描述在文本中需要匹配...

    正则表达式语法。介绍了基本表达式。

    关于正则表达式语法。介绍了基本表达式。可以用于快速查询表达式的匹配符。

    正则表达式语法大全

    正则表达式语法大全 正则表达式是一种强大的字符串匹配工具,它可以帮助开发者快速地从大量文本数据中提取有用的信息。下面是正则表达式语法大全,涵盖了基本元字符、量词、分组、断言、锚点、字符类、转义字符等...

    C#正则表达式语法

    C#中的正则表达式是一种强大的文本处理工具,它允许程序员通过特定的语法来匹配、查找、替换或者解析复杂的字符串模式。正则表达式在C#中被广泛应用于数据验证、文本提取、日志分析等多个场景。 在C#中,正则表达式...

    正则表达式语法(常用的正则表达式)

    正则表达式语法 正则表达式是一个强大的字符串处理工具,广泛应用于窗体验证、文本处理等领域。下面是正则表达式语法的详细介绍: 1. 元字符 元字符是正则表达式的特殊字符,它们具有特殊的含义。常见的元字符...

    正则表达式教程:30分钟让你精通正则表达式语法 _

    正则表达式教程:30分钟让你精通正则表达式语法 _

    正则表达式语法和示例

    正则表达式是一种强大的文本处理...总之,正则表达式是处理字符串的强大工具,熟练掌握其语法和规则,将极大提升你在文本处理和数据分析方面的效率。通过练习和实践,你可以创建出更复杂的正则表达式,解决实际问题。

    PB实现的正则表达式

    需要注意的是,由于PowerBuilder 11.5年代较久,其支持的正则表达式功能可能相对较弱,对于现代的复杂正则表达式语法可能不完全兼容。在使用时,开发者可能需要查阅相关的文档,或者考虑升级到支持更强大正则表达式...

    正则表达式(Deelx版)|正则表达式(Deelx版)支持库

    3. **正则表达式语法** - **量词**:如`*`, `+`, `?`, `{n}`, `{n,}` 和 `{n,m}` 控制匹配次数。 - **字符类**:如`[abc]`匹配a、b或c,`[^abc]`匹配除a、b、c外的任何字符。 - **边界匹配器**:`\b`匹配单词边界...

    C语言正则表达式库

    这个库名为PCRE(Perl Compatible Regular Expressions),正如其名,它与Perl语言中的正则表达式语法高度兼容,提供了丰富的功能和强大的匹配能力。PCRE2-10.31是该库的一个具体版本,包含了一系列头文件和库文件,...

    pb 使用正则表达式源码pbregexp

    描述中提到的“pb中使用正则表达式组件,通过该组件可以在pb脚本中使用功能强大的正则表达式”,强调了pbregexp组件的强大功能,意味着它可能支持丰富的正则表达式语法,如量词(*、+、?)、字符类、预定义字符集、...

    正则表达式语法及常用正则表达式(附正则手册)

    提供的HTML手册可能包含了更详细的正则表达式语法、特殊字符、高级技巧以及实例。手册通常会涵盖正则表达式的元字符、预定义字符类、选择、重复、分组、反向引用、否定预查等内容,并且会有大量的实例解析,帮助读者...

    正则表达式语法,可以参考下奥

    它通过一套预定义的规则,也就是正则表达式语法,来描述文本的模式。在编程语言和许多文本编辑器中,正则表达式被广泛用于数据验证、搜索和提取等功能。 在正则表达式的语法中,有几个关键的元字符和构造: 1. **^...

    正则表达式语法.docx

    正则表达式是一种强大的文本处理工具,用于在字符串中查找、替换或提取符合特定模式的文本。...理解并熟练掌握正则表达式语法,可以极大地提高处理文本数据的效率,广泛应用于编程、数据分析、文本挖掘等多个领域。

    正则表达式测试工具C#版(src)

    2. **正则表达式语法** - 基本元字符:如`.`(匹配任意字符,除换行符)、`^`(匹配行首)、`$`(匹配行尾)、`\d`(匹配数字)、`\w`(匹配字母数字下划线)等。 - 量词:`*`(零个或多个)、`+`(一个或多个)、...

Global site tag (gtag.js) - Google Analytics