`

正则基本知识

阅读更多

 

表达式的构造

 

正则表达式中/i,/g,/ig,/gi,/m的区别和含义

/i (忽略大小写)

/g (全文查找出现的所有匹配字符)

/m (多行查找)

/gi(全文查找、忽略大小写)

/ig(全文查找、忽略大小写)

 

 

\t

制表符 ('\u0009')

\n

新行(换行)符 ('\u000A')

\r

回车符 ('\u000D')

\f

换页符 ('\u000C')

\a

报警 (bell) 符 ('\u0007')

\e

转义符 ('\u001B')

 

字符类

 

[abc]

a、b 或 c(简单类)

[^abc]

任何字符,除了 a、b 或 c(否定)

[a-zA-Z]

a 到 z 或 A 到 Z,两头的字母包括在内(范围)

[a-d[m-p]]

a 到 d 或 m 到 p:[a-dm-p](并集)

[a-z&&[def]]

d、e 或 f(交集)

[a-z&&[^bc]]

a 到 z,除了 b 和 c:[ad-z](减去)

[a-z&&[^m-p]]

a 到 z,而非 m 到 p:[a-lq-z](减去)

预定义字符类

 

.

任何字符(与行结束符 可能匹配也可能不匹配)

\d

数字:[0-9]

\D

非数字: [^0-9]

\s

空白字符:[ \t\n\x0B\f\r]

\S

非空白字符:[^\s]

\w

单词字符:[a-zA-Z_0-9]

\W

非单词字符:[^\w]

POSIX 字符类(仅 US-ASCII)

 

\p{Lower}

小写字母字符:[a-z]

\p{Upper}

大写字母字符:[A-Z]

\p{ASCII}

所有 ASCII:[\x00-\x7F]

\p{Alpha}

字母字符:[\p{Lower}\p{Upper}]

\p{Digit}

十进制数字:[0-9]

\p{Alnum}

字母数字字符:[\p{Alpha}\p{Digit}]

\p{Punct}

标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

\p{Graph}

可见字符:[\p{Alnum}\p{Punct}]

\p{Print}

可打印字符:[\p{Graph}\x20]

\p{Blank}

空格或制表符:[ \t]

\p{Cntrl}

控制字符:[\x00-\x1F\x7F]

\p{XDigit}

十六进制数字:[0-9a-fA-F]

\p{Space}

空白字符:[ \t\n\x0B\f\r]

java.lang.Character 类(简单的 java 字符类型

 

\p{javaLowerCase}

等效于 java.lang.Character.isLowerCase()

\p{javaUpperCase}

等效于 java.lang.Character.isUpperCase()

\p{javaWhitespace}

等效于 java.lang.Character.isWhitespace()

\p{javaMirrored}

等效于 java.lang.Character.isMirrored()

Unicode 块和类别的类

 

\p{InGreek}

Greek   块(简单 )中的字符

\p{Lu}

大写字母(简单类别

\p{Sc}

货币符号

\P{InGreek}

所有字符,Greek 块中的除外(否定)

[\p{L}&&[^\p{Lu}]]  

所有字母,大写字母除外(减去)

边界匹配器

 

^

行的开头

$

行的结尾

\b

单词边界

\B

非单词边界

\A

输入的开头

\G

上一个匹配的结尾

\Z

输入的结尾,仅用于最后的结束符 (如果有的话)

\z

输入的结尾

Greedy 数量词

 

X ?

X ,一次或一次也没有

X *

X ,零次或多次

X +

X ,一次或多次

X {n }

X ,恰好 n

X {n ,}

X ,至少 n

X {n ,m }

X ,至少 n 次,但是不超过 m

Reluctant 数量词

 

X ??

X ,一次或一次也没有

X *?

X ,零次或多次

X +?

X ,一次或多次

X {n }?

X ,恰好 n

X {n ,}?

X ,至少 n

X {n ,m }?

X ,至少 n 次,但是不超过 m

Possessive 数量词

 

X ?+

X ,一次或一次也没有

X *+

X ,零次或多次

X ++

X ,一次或多次

X {n }+

X ,恰好 n

X {n ,}+

X ,至少 n

X {n ,m }+

X ,至少 n 次,但是不超过 m

Logical 运算符

 

XY

X 后跟 Y

X |Y

XY

(X )

X,作为捕获组

Back 引用

 

\n

任何匹配的 n th 捕获组

引用

 

\

Nothing,但是引用以下字符

\Q

Nothing,但是引用所有字符,直到 \E

\E

Nothing,但是结束从 \Q 开始的引用

特殊构造(非捕获)

 

(?:X )

X ,作为非捕获组

(?idmsux-idmsux)  

Nothing,但是将匹配标志由 on 转为 off

(?idmsux-idmsux: X )   

X ,作为带有给定标志 on - off 的非捕获组

(?=X )

X ,通过零宽度的正 lookahead

(?!X )

X ,通过零宽度的负 lookahead

(?<=X )

X ,通过零宽度的正 lookbehind

(?<!X )

X ,通过零宽度的负 lookbehind

(?>X )

X ,作为独立的非捕获组

 

组和捕获

捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C))) 中,存在四个这样的组:

 

1     

((A)(B(C)))

2     

\A

3     

(B(C))

4     

(C)

 

分享到:
评论

相关推荐

    正则表达式工具(附正则表达式知识、示例)

    一、正则表达式基础知识 1. 基本元素: - 字符:匹配自身,如"a"匹配字符"a"。 - 范围字符:如[a-z],匹配任何小写字母。 - 通配符:.,匹配任意单个字符。 - 量词:*、+、?,分别代表零或多个、一个或多个、零...

    正则表达式(基本包含所有验证的正则)

    ### 正则表达式知识点详解 #### 一、概述 正则表达式是一种强大的文本处理工具,能够帮助我们在文本中进行查找、替换等操作。它通过一系列简短的符号组合来匹配字符串中的某些部分,从而实现高效的数据处理。在本篇...

    js正则表达基本知识.

    ### JavaScript正则表达式基础知识详解 #### 一、正则表达式的创建与初始化 在JavaScript中,正则表达式可以通过两种方式创建: 1. **构造函数方式**:使用`RegExp`构造函数创建正则表达式对象。 ```javascript ...

    正则表达式知识示例详解源代码(java版)

    1. **基本字符**:包括字母、数字、空格等常规字符,它们可以直接匹配文本中的对应字符。 2. **元字符**:如`. ^ $ * + ? { [ ] \ | ( )`,它们具有特殊含义,在正则表达式中用来构建更复杂的模式。例如,`.`匹配...

    正则表达式的基础知识!

    以下是对正则表达式基础知识的详细解释: 1. **基础匹配**: - **基础匹配**:最简单的正则表达式就是你要匹配的文本本身,如"cat",可以匹配含有"cat"的字符串。 2. **句点符号(.)**: - **句点符号**:"....

    正则表达式调试工具

    综上所述,"正则表达式调试工具V3.0 绿色免费版"是一款实用的开发辅助工具,不仅提供了基本的正则表达式测试功能,还通过经典例程和跨平台特性,为开发者提供了便利的学习和调试环境。使用这款工具,开发者可以更好...

    正则表达式.doc 正则表达式

    正则表达式的基础知识包括以下几个核心概念: 1. **句点符号 (.)**:句点匹配任意单个字符,包括空格和换行符。例如,"t.n"会匹配到"tan", "ten", "tin", "ton"以及包含"t"和"n"的其他组合。 2. **方括号符号 ([.....

    正则表达式.docx

    这篇文章将会详细介绍正则表达式的基础知识点,包括正则表达式的定义、基本语法、元字符、字符类、预定义类等。 一、正则表达式的定义 正则表达式是使用单个字符串来描述/匹配一系列符合某个语法规则的字符串。在 ...

    matlab编写的图像处理正则化软件包。包含了基本的数字图像

    这个特定的软件包“RestoreTools”很可能包含了以下知识点: 1. **正则化方法**:正则化通常包括拉普拉斯正则化、Tikhonov正则化(也称为L2正则化)、L1正则化(也称为稀疏正则化)等,这些方法在图像恢复中可以...

    正则表达式正则表达式.zip

    正则表达式的基本元素包括: 1. 字符:单个字符,如"a"、"b"等,可以直接匹配相应的字符。 2. 重复量词:如"*"(零次或多次)、"+"(一次或多次)、"?"(零次或一次)以及"{n}"(恰好n次)、"{n,}"(至少n次)、"{n...

    正则模拟器

    "正则表达式30分钟入门教程.url" 是一个链接文件,其扩展名 ".url" 表明它指向一个网页资源,可能是提供正则表达式基础知识的在线教程。这类教程通常会涵盖基础语法,如字符类、量词、分组、预查、边界等等,以及...

    正则表达式客户端工具

    以下是该工具的主要特点和相关知识点: 1. 常用正则表达式库:工具内置了一套常用正则表达式模式,覆盖了常见的文本匹配需求,如邮箱地址验证、电话号码检查、URL检测等。这使得用户无需从头开始构建复杂的正则...

    正则表达式(一)从初学到精通正则表达式

    本文将对正则表达式的基础知识进行详细的介绍,从什么是正则表达式开始,逐步深入浅出地讲解正则表达式的基本概念、正则表达式引擎、文字符号、特殊字符、不可显示字符、正则表达式引擎的内部工作机制等。...

    正则表达式测试工具C#版(src)

    正则表达式是一种强大的文本...通过深入研究这个C#版的正则表达式测试工具源码,开发者不仅可以巩固正则表达式的基础知识,还可以提升在C#环境中应用正则表达式的能力,同时学习到UI设计和事件处理等方面的实践技巧。

    正则表达式测试工具regtool

    正则表达式的基础知识点包括: 1. 字符类:如 `[abc]` 表示匹配 a、b 或 c 中的任意一个字符。 2. 量词:`*` 表示前面的字符可以出现零次或多次,`+` 表示至少一次,`?` 表示零次或一次。 3. 重复范围:`{n}` 表示 ...

    Java正则表达式 Java 正则表达式

    1. **基本概念与用途** - 正则表达式主要用途包括字符串匹配、查找和替换。 - 例如,可以使用正则表达式检查输入的IP地址是否符合规范,从网页文本中提取电子邮件地址或者超链接。 2. **核心类** - `java.lang....

    易语言正则万能匹配

    本文将深入探讨易语言正则万能匹配的相关知识点,包括正则表达式的基本概念、元字符转义以及相关的函数使用。 首先,我们需要理解正则表达式(Regular Expression)的概念。正则表达式是一种模式,用于在字符串中...

    正则表达式 Regular Expression 正则表达式资料大全压缩包

    1. **基础教程**:介绍正则表达式的入门知识,包括基本语法和常用元字符。 2. **进阶指南**:讲解高级特性和技巧,如后向引用、条件表达式等。 3. **实例解析**:通过实际例子演示正则表达式的应用。 4. **代码示例*...

    快速完全精通正则表达式

    ### 快速完全精通正则表达式 ...它涵盖了正则表达式从入门到精通所需的所有知识点,并通过大量的实例帮助读者更好地理解和运用这些知识。无论是新手还是有一定基础的开发者,都可以从中获得宝贵的知识和技能。

    VBA中的正则表达式

    VBA中的正则表达式,正则表达式的基本知识讲解!

Global site tag (gtag.js) - Google Analytics