`
chengzhi_hong
  • 浏览: 167399 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

正则表达式基础教程

    博客分类:
  • J2SE
阅读更多

 

字符

x

字符 x

\\

反斜线字符

\0n

带有八进制值 0 的字符 n (0 <= n <= 7)

\0nn

带有八进制值 0 的字符 nn (0 <= n <= 7)

\0mnn

带有八进制值 0 的字符 mnn0 <= m <= 30 <= n <= 7

\xhh

带有十六进制值 0x 的字符 hh

\uhhhh

带有十六进制值 0x 的字符 hhhh

\t

制表符 ('\u0009')

\n

新行(换行)符 ('\u000A')

\r

回车符 ('\u000D')

\f

换页符 ('\u000C')

\a

报警 (bell) ('\u0007')

\e

转义符 ('\u001B')

\cx

对应于 x 的控制符

 

 

字符类

[abc]

ab c(简单类)

[^abc]

任何字符,除了 ab c(否定)

[a-zA-Z]

a z A Z,两头的字母包括在内(范围)

[a-d[m-p]]

a d m p[a-dm-p](并集)

[a-z&&[def]]

de f(交集)

[a-z&&[^bc]]

a z,除了 b c[ad-z](减去)

[a-z&&[^m-p]]

a z,而非 m p[a-lq-z](减去)

 

 

预定义字符类

.

任何字符(与行结束符可能匹配也可能不匹配)

\d

数字:[0-9]

\D

非数字: [^0-9]

\s

空白字符:[ \t\n\x0B\f\r]

\S

非空白字符:[^\s]

\w

单词字符:[a-zA-Z_0-9]

\W

非单词字符:[^\w]

 

 

POSIX 字符类(仅 US-ASCII

\p{Lower}

小写字母字符:[a-z]

\p{Upper}

大写字母字符:[A-Z]

\p{ASCII}

所有 ASCII[\x00-\x7F]

\p{Alpha}

字母字符:[\p{Lower}\p{Upper}]

\p{Digit}

十进制数字:[0-9]

\p{Alnum}

字母数字字符:[\p{Alpha}\p{Digit}]

\p{Punct}

标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

\p{Graph}

可见字符:[\p{Alnum}\p{Punct}]

\p{Print}

可打印字符:[\p{Graph}\x20]

\p{Blank}

空格或制表符:[ \t]

\p{Cntrl}

控制字符:[\x00-\x1F\x7F]

\p{XDigit}

十六进制数字:[0-9a-fA-F]

\p{Space}

空白字符:[ \t\n\x0B\f\r]

 

 

java.lang.Character 类(简单的 java 字符类型

\p{javaLowerCase}

等效于 java.lang.Character.isLowerCase()

\p{javaUpperCase}

等效于 java.lang.Character.isUpperCase()

\p{javaWhitespace}

等效于 java.lang.Character.isWhitespace()

\p{javaMirrored}

等效于 java.lang.Character.isMirrored()

 

 

Unicode 块和类别的类

\p{InGreek}

Greek 块(简单)中的字符

\p{Lu}

大写字母(简单类别

\p{Sc}

货币符号

\P{InGreek}

所有字符,Greek 块中的除外(否定)

[\p{L}&&[^\p{Lu}]] 

所有字母,大写字母除外(减去)

 

 

边界匹配器

^

行的开头

$

行的结尾

\b

单词边界

\B

非单词边界

\A

输入的开头

\G

上一个匹配的结尾

\Z

输入的结尾,仅用于最后的结束符(如果有的话)

\z

输入的结尾

 

 

Greedy 数量词

X?

X,一次或一次也没有

X*

X,零次或多次

X+

X,一次或多次

X{n}

X,恰好 n

X{n,}

X,至少 n

X{n,m}

X,至少 n 次,但是不超过 m

 

 

Reluctant 数量词

X??

X,一次或一次也没有

X*?

X,零次或多次

X+?

X,一次或多次

X{n}?

X,恰好 n

X{n,}?

X,至少 n

X{n,m}?

X,至少 n 次,但是不超过 m

 

 

Possessive 数量词

X?+

X,一次或一次也没有

X*+

X,零次或多次

X++

X,一次或多次

X{n}+

X,恰好 n

X{n,}+

X,至少 n

X{n,m}+

X,至少 n 次,但是不超过 m

 

 

Logical 运算符

XY

X 后跟 Y

X|Y

X Y

(X)

X,作为捕获组

 

 

Back 引用

\n

任何匹配的 nth 捕获组

 

 

引用

\

Nothing,但是引用以下字符

\Q

Nothing,但是引用所有字符,直到 \E

\E

Nothing,但是结束从 \Q 开始的引用

 

 

特殊构造(非捕获)

(?:X)

X,作为非捕获组

(?idmsux-idmsux) 

Nothing,但是将匹配标志i d m s u x on - off

(?idmsux-idmsux:X)  

X,作为带有给定标志 i d m s u x on - off非捕获组

(?=X)

X,通过零宽度的正 lookahead

(?!X)

X,通过零宽度的负 lookahead

(?<=X)

X,通过零宽度的正 lookbehind

(?<!X)

X,通过零宽度的负 lookbehind

(?>X)

X,作为独立的非捕获组

 

分享到:
评论

相关推荐

    01C#正则表达式基础教程.doc

    **正则表达式基础教程** 1. **本文目标** 本教程旨在为C#开发者提供正则表达式的基础知识,帮助理解正则表达式的概念、语法和常见用途。通过学习,你将能够编写和使用正则表达式进行文本匹配、验证和处理。 2. **...

    详细的C#正则表达式基础教程

    本教程将深入探讨C#中的正则表达式基础,帮助你掌握这一核心技能。 1. **正则表达式简介** 正则表达式(Regular Expression)是一种模式匹配语言,用于在字符串中查找、替换或捕获特定模式。它通过一套特殊语法来...

    正则表达式基础教程(内含正则表达是的练习器)

    通过这个基础教程,你将学习如何使用这些元素构建复杂的正则表达式,并使用正则表达式练习器进行实践。这个练习器可以帮助你实时验证和调试你的正则表达式,从而加深理解和记忆。 总之,掌握正则表达式不仅可以提高...

    正则表达式入门教程(pdf版

    学习正则表达式通常从理解基础的元字符和构造简单表达式开始。随着学习的深入,会接触到更复杂的概念,如字符类(class)、分枝条件(branch)、分组(group)、后向引用(backreference)、零宽断言(lookaround)...

    正则表达式系统教程.CHM

    1. **正则表达式基础** - **元字符**:正则表达式中的特殊符号,如`.`代表任意字符,`^`表示行首,`$`表示行尾,`\`用于转义。 - **字符类**:使用方括号`[]`定义一组字符,如`[abc]`匹配'a'、'b'或'c'。 - **...

    正则表达式系统教程.RAR

    《正则表达式系统教程.CHM》可能是这门课程的主要教材,CHM是微软编写的帮助文档格式,通常包含详细的章节和示例,让你逐步了解正则表达式的基础语法、元字符、量词、边界匹配等核心概念。例如,你将学习到如何使用...

    Java使用正则表达式提取XML节点内容的方法示例

    为了帮助开发者更好地掌握Java正则表达式技术,我们提供了一系列的Java正则表达式技巧大全,包括《Java正则表达式技巧大全》、《Java数据结构与算法教程》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧...

    java正则表达式实例教程

    1. 正则表达式基础: - 定义:正则表达式是由字符、元字符和操作符组成的模式,用于描述字符串的模式。 - 元字符:如"."代表任意字符,"*"表示前面的元素可以重复零次或多次,"+"表示至少一次,"?"表示零次或一次...

    正则表达式系统教程CHM

    1. **基础概念**:首先,教程会介绍正则表达式的起源和发展,以及其在不同语言和平台中的应用。它可能会解释什么是字符类、量词、分组、锚点等基本元素,这些都是构建正则表达式的基础。 2. **元字符**:元字符是...

    .NET正则表达式基础教程代码

    在本基础教程中,我们将探讨如何使用.NET正则表达式进行字符串操作,特别是在Visual Studio 2013环境下。 首先,我们要理解字符组(Character Groups)。字符组允许我们指定一组字符,正则表达式将在匹配时考虑这组...

    正则表达式 正则表达式资料 正则表达式教程

    ### 一、正则表达式基础知识 #### 1.1 什么是正则表达式? 正则表达式(Regular Expression)是一种强大的文本处理工具,能够帮助用户或程序查找、替换或提取字符串中的模式。它广泛应用于各种编程语言和软件工具中...

    正则表达式自动生成器 V2.0.0.1 官方多语版

    5. **教程和帮助文档**:通常,软件会附带详细的使用说明或教程,帮助用户学习和理解正则表达式的基础知识和高级技巧。 压缩包内的`regexBuilderSetup_std.exe`是安装程序,用户可以通过运行这个文件来安装正则...

    《易语言“正则表达式”教程》.doc

    本教程内容丰富,既适合初学者入门,也适合有一定基础的开发者深化对正则表达式的理解。通过学习,读者不仅能够掌握正则表达式的原理和使用,还能了解如何在易语言环境下高效地运用这一工具,从而提升自己的编程技能...

    正则表达式 必知必会 pdf

    本书基于各种实用场景,从基础的文本匹配开始,逐步深入到回溯引用、条件性求值以及前后查找等高级特性,使得读者能够系统、全面地掌握正则表达式的使用方法,并将其应用于解决实际问题中。 书中介绍的正则表达式...

    最新正则表达式系统教程

    这份教程可能涵盖基础语法、高级特性、常见问题解决方案以及实战应用案例,帮助你成为正则表达式的专家。通过学习和实践,你将能够编写出复杂的正则表达式,高效地处理各种文本数据,提升工作效率。

Global site tag (gtag.js) - Google Analytics