`
FlyAway2
  • 浏览: 111771 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

java正则表达式的学习

    博客分类:
  • j2se
 
阅读更多

正则表达式看似简单,要灵活使用却很难,至少我感觉是这样,(可能是做少了练习),你说要你写个邮件的正则表达式什么的,你都总是出错,别人怎么看你?唉,我当初公司评级考试的时候,就是写错了,导致严重后果啊。我能说什么呢,向谁去说呢,自己确实没学好,老忘记,对^$的恐惧感,那些简单的\d、\w、\s的意思都记不住或者记不清,导致不敢用。学业不精啊,误己误人!

 

 

参照 http://blog.csdn.net/allwefantasy/article/details/3136570

位于 java.util.regex 下,提供一些列很有用很强大的正则表达式处理接口:

 

接口  

MatchResult 此接口包含用于确定与正则表达式匹配结果的查询方法。通过 MatchResult 可以查看匹配边界、组和组边界,但是不能修改。 

匹配边界、组和组边界 ???????

 

类  

Matcher 

public final class Matcher extends Object implements MatchResult通过解释 Pattern 对 character sequence 执行匹配操作的引擎。 —————————— 这就是‘引擎’!!!

可以使用它执行三种不同的匹配操作: 

 

matches 方法尝试将整个输入序列与该模式匹配。 —————————————— 注意:需要匹配整个区域

lookingAt 尝试将输入序列从头开始与该模式匹配。           与 matches 方法类似,此方法始终从区域的开头开始;与之不同的是,它不需要匹配整个区域。 

与 matches 方法类似,此方法始终从区域的开头开始;与之不同的是,它不需要匹配整个区域。 

 

 

find 方法扫描输入序列以查找与该模式匹配的下一个子序列。 

 

每个方法都返回一个表示成功或失败的布尔值

 

 

 

Pattern ———————————————————————————————————————————————————————————————————————————————————————————— 通过compile(String regex, int flags) 来建立匹配模式,无构造方法

public final class Pattern extends Object implements Serializable 正则表达式的编译表示形式。

指定为字符串的正则表达式必须首先被编译为此类的实例。然后,可将得到的模式用于创建 Matcher 对象

 

 

异常  

PatternSyntaxException 

 

 

1.1 句点符号

 

1.2 方括号符号

为了解决句点符号匹配范围过于广泛这一问题,你可以在方括号(“[]”)里面指定看来有意义的字符。此时,只有方括号里面指定的字符才参与匹配

正则表达式“t[aeio]n”只匹配“tan”、“Ten”、“tin”和“ton”。但“Toon”不匹配,因为在方括号之内你只能匹配单个字符 —————————————— !!!!!!!!!!!!

 

 

1.3 “或”符号

如果除了上面匹配的所有单词之外,你还想要匹配“toon”,那么,你可以使用“|”操作符。“|”操作符的基本意义就是“或”运算。

要匹配“toon”,使用“t(a|e|i|o|oo)n”正则表达式。这里不能使用方括号,

因为方括号只允许匹配单个字符;这里必须使用圆括号“()”。圆括号还可以用来分组,具体请参见后面介绍。—————————— ()威力大!

 

1.4 表示匹配次数的符号

表一显示了表示匹配次数的符号,这些符号用来确定紧靠该符号【左边】的符号出现的次数

* 0或多次

+ 1或多次

?0或1次

{n} 恰好n次 ______ 注意是花括号 {}!!!!!

{n,m} 从n到m次都可以,m>n—————————— 或者说:至少 n 次,但是不超过 m 次

 

 

在正则表达式中,连字符(“-”)有着特殊的意义,它表示一个范围,比如从0到9。

因此,匹配社会安全号码中的连字符号时,它的前面要加上一个转义字符“\”

 

 

 

1.5 “否”符号

“^”符号称为“否”符号。如果用在方括号内,“^”表示不想要匹配的字符。例如,图四的正则表达式匹配所有单词

匹配所有单词,但“X”开头的除外——————  [^x][a-z]+

 

 

 

 

 

 

 

:注意,下面只会去尝试匹配一个字符

“\s”符号是空白符号,匹配所有的空白字符,包括Tab字符

\S 上者的非

\d 数字0-9

\D 

\w 单词字符:[a-zA-Z_0-9] 就是字母、数字

\W

 

 

边界匹配器 

^ 行的开头 

$ 行的结尾 

\b 单词边界 

\B 非单词边界 

\A 输入的开头 

\G 上一个匹配的结尾 

\Z 输入的结尾,仅用于最后的结束符(如果有的话) 

\z 输入的结尾 

 

Greedy 数量词 

X? X,一次或一次也没有 

X* X,零次或多次 

X+ X,一次或多次 

X{n} X,恰好 n 次 

X{n,} X,至少 n 次 

X{n,m} X,至少 n 次,但是不超过 m 次 

 

 

 

Logical 运算符 

XY X 后跟 Y 

X|Y X 或 Y 

(X) X,作为【捕获组】 —————————— 这个概念很重要

 

Back 引用 

\n 任何匹配的 nth 捕获组 

 

 

引用 

\ Nothing,但是引用以下字符 

\Q Nothing,但是引用所有字符,直到 \E 

\E Nothing,但是结束从 \Q 开始的引用 

 

特殊构造(非捕获) 

(?:X) X,作为非捕获组 

(?idmsux-idmsux)  Nothing,但是将匹配标志i d m s u x on - off 

(?idmsux-idmsux:X)   X,作为带有给定标志 i d m s u x on - off 

的非捕获组  (?=X) X,通过零宽度的正 lookahead 

(?!X) X,通过零宽度的负 lookahead 

(?<=X) X,通过零宽度的正 lookbehind 

(?<!X) X,通过零宽度的负 lookbehind 

(?>X) X,作为独立的非捕获组 

 

 

usePattern(Pattern newPattern) 更改此 Matcher 用于查找匹配项的 Pattern。

 

 

public String group(int i)返回上次匹配操作的某个group。如果匹配成功,但是没能找到group,则返回null。











当正则表达式中包含能接受重复的限定符时 ———————————————— 即某字符后出现多个次数限定符
通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。
考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。
如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。
有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,
只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。
现在看看懒惰版的例子吧:
a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab(为什么第一个匹配是aab而不是ab?简单地说,因为正则表达式有另一条规则,比懒惰/贪婪规则的优先级更高:最先开始的区配最有最大的优先权——The Match That Begins Earliest Wins)。
表5.懒惰限定符
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复

 那么(,m)———————— 代表什么呢




正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。

匹配中文字符的正则表达式: [/u4e00-/u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了

匹配双字节字符(包括汉字在内):[^/x00-/xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

匹配空白行的正则表达式:/n/s*/r
评注:可以用来删除空白行

匹配HTML标记的正则表达式:<(/S*?)[^>]*>.*?<//1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

匹配首尾空白字符的正则表达式:^/s*|/s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

匹配Email地址的正则表达式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
评注:表单验证时很实用

匹配网址URL的正则表达式:[a-zA-z]+://[^/s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用

匹配国内电话号码:/d{3}-/d{8}|/d{4}-/d{7}
评注:匹配形式如 0511-4405222 或 021-87888822

匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始

匹配中国邮政编码:[1-9]/d{5}(?!/d)
评注:中国邮政编码为6位数字

匹配身份证:/d{15}|/d{18}
评注:中国的身份证为15位或18位

匹配ip地址:/d+/./d+/./d+/./d+
评注:提取ip地址时有用

匹配特定数字:
^[1-9]/d*$ //匹配正整数
^-[1-9]/d*$ //匹配负整数
^-?[1-9]/d*$ //匹配整数
^[1-9]/d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]/d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]/d*/./d*|0/./d*[1-9]/d*$ //匹配正浮点数
^-([1-9]/d*/./d*|0/./d*[1-9]/d*)$ //匹配负浮点数
^-?([1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0)$ //匹配浮点数
^[1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]/d*/./d*|0/./d*[1-9]/d*))|0?/.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正

匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^/w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
评注:最基本也是最常用的一些表达式
分享到:
评论

相关推荐

    java正则表达式学习

    【Java正则表达式学习】 Java正则表达式是Java编程语言中用于处理字符串的强大工具,自JDK1.4版本起被引入。它源于PHP并迅速流行,主要用于复杂字符串的验证和处理。正则表达式可以高效地完成对字符串的检查、分割...

    Java 正则表达式学习

    ### Java正则表达式学习 #### 一、简介 在Java编程中,正则表达式是一种非常实用且强大的工具,用于处理字符串模式匹配与搜索替换等操作。通过本篇文章,我们将快速入门Java中的正则表达式,并掌握其基本用法。 #...

    java正则表达式学习笔记

    ### Java正则表达式基础知识与应用 #### 一、引言 正则表达式是一种强大的文本处理工具,它能够帮助开发者高效地进行字符串的搜索、替换等操作。Java中的正则表达式支持广泛的标准和特性,是进行文本处理任务的理想...

    java正则表达式匹配工具

    Java正则表达式匹配工具是IT领域中一种强大的文本处理工具,它利用正则表达式(Regular Expression)的规则来查找、替换或者提取文本中的特定模式。正则表达式是一种特殊的字符序列,能够帮助程序员或者用户高效地...

    JAVA正则表达式大全

    以下是对这些文档标题所涉及的Java正则表达式知识点的详细解释: 1. **正则表达式之道** 这个主题可能涵盖了正则表达式的基础概念,包括元字符、字符类、量词和分组。元字符如`.`代表任意字符,`^`表示行首,`$`...

    java正则表达式教程html版带目录

    Java正则表达式是Java编程语言中的一个强大工具,它用于模式匹配和字符串处理,尤其在数据验证、文本检索和替换等方面发挥着重要作用。...现在,打开`java正则表达式Regex.html`,开始你的Java正则表达式学习之旅吧!

    Java正则表达式.ppt

    Java正则表达式是一种强大的文本处理工具,广泛用于验证字符串、查找特定模式和替换文本。在Java中,正则表达式提供了简洁而灵活的方式来处理字符串,使得编程人员能够以更高效的方式实现各种文本操作。 正则表达式...

    java 正则表达式应用jar包 regex-smart.jar

    Java正则表达式是编程语言Java中的一个强大工具,它用于模式匹配、数据验证和文本检索替换。在Java中,正则表达式是通过java.util.regex包提供的接口和类来实现的。`regex-smart.jar`这个库显然是为了简化开发者在...

    常用java正则表达式

    ### 常用Java正则表达式知识点 #### 一、引言 正则表达式是一种强大的工具,用于处理文本并查找模式。多种编程语言,包括Perl、PHP、Python、JavaScript以及Java等均内置了对正则表达式的支持。本文将详细介绍Java...

    Java正则表达式详解(非常适合入门

    #### 三、Java正则表达式的实践学习 学习Java正则表达式,理论与实践并重。通过大量的匹配实例进行学习,可以更深刻地理解其工作原理和使用技巧。这对于从未接触过正则表达式或对其基础概念尚不熟悉的学习者来说,...

    java正则表达式使用例子

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许我们通过模式匹配来查找、替换或分割文本。在Android开发中,正则表达式尤其重要,因为它们可以帮助我们验证用户输入、处理文本数据或者进行复杂的...

    Java正则表达式快速学习

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本提取、搜索替换等。本篇文章将深入探讨Java中的...

    Java正则表达式学习教程

    " + Pattern.compile(".bb")....总之,Java正则表达式是开发过程中处理文本的强大工具,熟练掌握可以极大地提高文本处理的效率和准确性。通过深入学习和实践,你可以编写出复杂的正则表达式来解决各种字符串处理问题。

    java正则表达式截取demo下载即可运行

    通过运行提供的“java正则表达式截取demo”,你不仅可以学习到基本的正则表达式操作,还可以了解到如何在实际项目中应用这些知识。示例可能包括了不同类型的正则表达式以及它们在截取字符串时的具体用法,这对于提升...

    java正则表达式实例教程

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。本教程将深入讲解Java中的正则表达式,并提供丰富的实例来帮助开发者理解和应用这些概念。 1. 正则...

    java正则表达式及例子 pdf

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,...通过阅读《Java 正则表达式的总结和一些小例子.pdf》和《Java正则表达式详解.pdf》,你将能够深入学习和实践更多正则表达式的用法,进一步提升编程技能。

    Java 正则表达式判断字符串是否包含中文

    ### Java正则表达式判断字符串是否包含中文 在日常的软件开发过程中,我们经常会遇到需要对输入的字符串进行校验的情况。例如,在处理用户输入、文本分析或数据清洗时,可能需要判断一个字符串中是否包含中文字符。...

Global site tag (gtag.js) - Google Analytics