`

正则基本知识

阅读更多

 

表达式的构造

 

正则表达式中/i,/g,/ig,/gi,/m的区别和含义

/i (忽略大小写)

/g (全文查找出现的所有匹配字符)

/m (多行查找)

/gi(全文查找、忽略大小写)

/ig(全文查找、忽略大小写)

 

 

\t

制表符 ('\u0009')

\n

新行(换行)符 ('\u000A')

\r

回车符 ('\u000D')

\f

换页符 ('\u000C')

\a

报警 (bell) 符 ('\u0007')

\e

转义符 ('\u001B')

 

字符类

 

[abc]

a、b 或 c(简单类)

[^abc]

任何字符,除了 a、b 或 c(否定)

[a-zA-Z]

a 到 z 或 A 到 Z,两头的字母包括在内(范围)

[a-d[m-p]]

a 到 d 或 m 到 p:[a-dm-p](并集)

[a-z&&[def]]

d、e 或 f(交集)

[a-z&&[^bc]]

a 到 z,除了 b 和 c:[ad-z](减去)

[a-z&&[^m-p]]

a 到 z,而非 m 到 p:[a-lq-z](减去)

预定义字符类

 

.

任何字符(与行结束符 可能匹配也可能不匹配)

\d

数字:[0-9]

\D

非数字: [^0-9]

\s

空白字符:[ \t\n\x0B\f\r]

\S

非空白字符:[^\s]

\w

单词字符:[a-zA-Z_0-9]

\W

非单词字符:[^\w]

POSIX 字符类(仅 US-ASCII)

 

\p{Lower}

小写字母字符:[a-z]

\p{Upper}

大写字母字符:[A-Z]

\p{ASCII}

所有 ASCII:[\x00-\x7F]

\p{Alpha}

字母字符:[\p{Lower}\p{Upper}]

\p{Digit}

十进制数字:[0-9]

\p{Alnum}

字母数字字符:[\p{Alpha}\p{Digit}]

\p{Punct}

标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

\p{Graph}

可见字符:[\p{Alnum}\p{Punct}]

\p{Print}

可打印字符:[\p{Graph}\x20]

\p{Blank}

空格或制表符:[ \t]

\p{Cntrl}

控制字符:[\x00-\x1F\x7F]

\p{XDigit}

十六进制数字:[0-9a-fA-F]

\p{Space}

空白字符:[ \t\n\x0B\f\r]

java.lang.Character 类(简单的 java 字符类型

 

\p{javaLowerCase}

等效于 java.lang.Character.isLowerCase()

\p{javaUpperCase}

等效于 java.lang.Character.isUpperCase()

\p{javaWhitespace}

等效于 java.lang.Character.isWhitespace()

\p{javaMirrored}

等效于 java.lang.Character.isMirrored()

Unicode 块和类别的类

 

\p{InGreek}

Greek   块(简单 )中的字符

\p{Lu}

大写字母(简单类别

\p{Sc}

货币符号

\P{InGreek}

所有字符,Greek 块中的除外(否定)

[\p{L}&&[^\p{Lu}]]  

所有字母,大写字母除外(减去)

边界匹配器

 

^

行的开头

$

行的结尾

\b

单词边界

\B

非单词边界

\A

输入的开头

\G

上一个匹配的结尾

\Z

输入的结尾,仅用于最后的结束符 (如果有的话)

\z

输入的结尾

Greedy 数量词

 

X ?

X ,一次或一次也没有

X *

X ,零次或多次

X +

X ,一次或多次

X {n }

X ,恰好 n

X {n ,}

X ,至少 n

X {n ,m }

X ,至少 n 次,但是不超过 m

Reluctant 数量词

 

X ??

X ,一次或一次也没有

X *?

X ,零次或多次

X +?

X ,一次或多次

X {n }?

X ,恰好 n

X {n ,}?

X ,至少 n

X {n ,m }?

X ,至少 n 次,但是不超过 m

Possessive 数量词

 

X ?+

X ,一次或一次也没有

X *+

X ,零次或多次

X ++

X ,一次或多次

X {n }+

X ,恰好 n

X {n ,}+

X ,至少 n

X {n ,m }+

X ,至少 n 次,但是不超过 m

Logical 运算符

 

XY

X 后跟 Y

X |Y

XY

(X )

X,作为捕获组

Back 引用

 

\n

任何匹配的 n th 捕获组

引用

 

\

Nothing,但是引用以下字符

\Q

Nothing,但是引用所有字符,直到 \E

\E

Nothing,但是结束从 \Q 开始的引用

特殊构造(非捕获)

 

(?:X )

X ,作为非捕获组

(?idmsux-idmsux)  

Nothing,但是将匹配标志由 on 转为 off

(?idmsux-idmsux: X )   

X ,作为带有给定标志 on - off 的非捕获组

(?=X )

X ,通过零宽度的正 lookahead

(?!X )

X ,通过零宽度的负 lookahead

(?<=X )

X ,通过零宽度的正 lookbehind

(?<!X )

X ,通过零宽度的负 lookbehind

(?>X )

X ,作为独立的非捕获组

 

组和捕获

捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C))) 中,存在四个这样的组:

 

1     

((A)(B(C)))

2     

\A

3     

(B(C))

4     

(C)

 

分享到:
评论

相关推荐

    js正则表达基本知识.

    ### JavaScript正则表达式基础知识详解 #### 一、正则表达式的创建与初始化 在JavaScript中,正则表达式可以通过两种方式创建: 1. **构造函数方式**:使用`RegExp`构造函数创建正则表达式对象。 ```javascript ...

    正则表达式工具(附正则表达式知识、示例)

    一、正则表达式基础知识 1. 基本元素: - 字符:匹配自身,如"a"匹配字符"a"。 - 范围字符:如[a-z],匹配任何小写字母。 - 通配符:.,匹配任意单个字符。 - 量词:*、+、?,分别代表零或多个、一个或多个、零...

    正则表达式(基本包含所有验证的正则)

    ### 正则表达式知识点详解 #### 一、概述 正则表达式是一种强大的文本处理工具,能够帮助我们在文本中进行查找、替换等操作。它通过一系列简短的符号组合来匹配字符串中的某些部分,从而实现高效的数据处理。在本篇...

    正则表达式知识示例详解源代码(java版)

    1. **基本字符**:包括字母、数字、空格等常规字符,它们可以直接匹配文本中的对应字符。 2. **元字符**:如`. ^ $ * + ? { [ ] \ | ( )`,它们具有特殊含义,在正则表达式中用来构建更复杂的模式。例如,`.`匹配...

    正则表达式调试工具

    综上所述,"正则表达式调试工具V3.0 绿色免费版"是一款实用的开发辅助工具,不仅提供了基本的正则表达式测试功能,还通过经典例程和跨平台特性,为开发者提供了便利的学习和调试环境。使用这款工具,开发者可以更好...

    正则表达式.doc 正则表达式

    正则表达式的基础知识包括以下几个核心概念: 1. **句点符号 (.)**:句点匹配任意单个字符,包括空格和换行符。例如,"t.n"会匹配到"tan", "ten", "tin", "ton"以及包含"t"和"n"的其他组合。 2. **方括号符号 ([.....

    正则表达式.docx

    这篇文章将会详细介绍正则表达式的基础知识点,包括正则表达式的定义、基本语法、元字符、字符类、预定义类等。 一、正则表达式的定义 正则表达式是使用单个字符串来描述/匹配一系列符合某个语法规则的字符串。在 ...

    matlab编写的图像处理正则化软件包。包含了基本的数字图像

    这个特定的软件包“RestoreTools”很可能包含了以下知识点: 1. **正则化方法**:正则化通常包括拉普拉斯正则化、Tikhonov正则化(也称为L2正则化)、L1正则化(也称为稀疏正则化)等,这些方法在图像恢复中可以...

    正则表达式正则表达式.zip

    正则表达式的基本元素包括: 1. 字符:单个字符,如"a"、"b"等,可以直接匹配相应的字符。 2. 重复量词:如"*"(零次或多次)、"+"(一次或多次)、"?"(零次或一次)以及"{n}"(恰好n次)、"{n,}"(至少n次)、"{n...

    正则模拟器

    "正则表达式30分钟入门教程.url" 是一个链接文件,其扩展名 ".url" 表明它指向一个网页资源,可能是提供正则表达式基础知识的在线教程。这类教程通常会涵盖基础语法,如字符类、量词、分组、预查、边界等等,以及...

    正则表达式客户端工具

    以下是该工具的主要特点和相关知识点: 1. 常用正则表达式库:工具内置了一套常用正则表达式模式,覆盖了常见的文本匹配需求,如邮箱地址验证、电话号码检查、URL检测等。这使得用户无需从头开始构建复杂的正则...

    正则表达式(一)从初学到精通正则表达式

    本文将对正则表达式的基础知识进行详细的介绍,从什么是正则表达式开始,逐步深入浅出地讲解正则表达式的基本概念、正则表达式引擎、文字符号、特殊字符、不可显示字符、正则表达式引擎的内部工作机制等。...

    正则表达式测试工具C#版(src)

    正则表达式是一种强大的文本...通过深入研究这个C#版的正则表达式测试工具源码,开发者不仅可以巩固正则表达式的基础知识,还可以提升在C#环境中应用正则表达式的能力,同时学习到UI设计和事件处理等方面的实践技巧。

    正则表达式测试工具regtool

    正则表达式的基础知识点包括: 1. 字符类:如 `[abc]` 表示匹配 a、b 或 c 中的任意一个字符。 2. 量词:`*` 表示前面的字符可以出现零次或多次,`+` 表示至少一次,`?` 表示零次或一次。 3. 重复范围:`{n}` 表示 ...

    Java正则表达式 Java 正则表达式

    1. **基本概念与用途** - 正则表达式主要用途包括字符串匹配、查找和替换。 - 例如,可以使用正则表达式检查输入的IP地址是否符合规范,从网页文本中提取电子邮件地址或者超链接。 2. **核心类** - `java.lang....

    易语言正则万能匹配

    本文将深入探讨易语言正则万能匹配的相关知识点,包括正则表达式的基本概念、元字符转义以及相关的函数使用。 首先,我们需要理解正则表达式(Regular Expression)的概念。正则表达式是一种模式,用于在字符串中...

    正则表达式 Regular Expression 正则表达式资料大全压缩包

    1. **基础教程**:介绍正则表达式的入门知识,包括基本语法和常用元字符。 2. **进阶指南**:讲解高级特性和技巧,如后向引用、条件表达式等。 3. **实例解析**:通过实际例子演示正则表达式的应用。 4. **代码示例*...

    快速完全精通正则表达式

    ### 快速完全精通正则表达式 ...它涵盖了正则表达式从入门到精通所需的所有知识点,并通过大量的实例帮助读者更好地理解和运用这些知识。无论是新手还是有一定基础的开发者,都可以从中获得宝贵的知识和技能。

    VBA中的正则表达式

    VBA中的正则表达式,正则表达式的基本知识讲解!

    常用正则表达式大全.txt

    根据提供的文件信息,我们可以整理出一系列与正则表达式相关的知识点。这些知识点涵盖了从基本的数字验证到复杂的字符串匹配等多个方面。下面是详细的知识点总结: ### 基本概念 正则表达式是一种用于文本模式匹配...

Global site tag (gtag.js) - Google Analytics