`

Java处理正则表达式

    博客分类:
  • Java
阅读更多

Java本身的Util包里面就有提供处理正则表达式的工具类,当然还有很多第三方正则表达式处理包,反正到目前为止,用java.util.regex就已经能满足我的需求了。示例如下:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Hello {
	public static void main(String[] args) {
		String regEx = "[0-9]{6}";//正则表达式 
		String html = "124595#123456123";//要检查匹配的字符串
		Pattern p = Pattern.compile(regEx);     
		Matcher m = p.matcher(html);
		System.out.println(""+m.groupCount());
		while(m.find()){ 
		    System.out.println(m.group()+" "+m.start()+" "+(m.end()-1));       
		}      	  
	}
}

 

 打印结果如下:

0
124595 0 5
123456 7 12

 这里的问题是groupCount为什么是0。group()、group(i)、groupCount到底指的是什么,网上普遍的解释:

http://hi.baidu.com/personnel/item/2a7eebbf5ccb61422bebe352 写道

 

首先弄明白Java的正则表达式中捕获组的概念,也就是以括号对“()”分割出的子Pattern,为什么要用到子模式呢?这是为了能在一次匹配中找出关心部分,例如:
input: abbc
pattern:a(b*)c
group0: a(b*)c
group1:(b*)

整个pattern是可以匹配abbc的,group()方法就是获得当前查找里面整个pattern所匹配的子序列,所以你可以通过group()找到“abbc”。

与此同时,我还对其中的b的个数感兴趣,就可以通过group1来得到关于(b*)的匹配情况,group(i)就是获得当前查找里面指定的捕获组所匹配的子序列,所以你可以通过group(0)来找到“bb”。

上面说清楚了,groupCount()的含义就很容易明白了,它并不是指在输入序列中Pattern总共匹配了多少次,而是指的捕获组的个数,当然它不对“整个pattern”计数,而只对“子Pattern”计数,如上例中groupCount()返回1,而如果我们将input改为“abbc abbc abbc”,——有三次匹配——groupCount()还是返回1。

 测试代码:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Hello {
	public static void main(String[] args) {
		String regEx = "t(\\d{0,3})n";//正则表达式 
		String html = "12t32nst567n";//要检查匹配的字符串
		Pattern p = Pattern.compile(regEx);     
		Matcher m = p.matcher(html);
		System.out.println(""+m.groupCount());
		while(m.find()){ 
		    System.out.println(m.group()+" "+m.start()+" "+(m.end()-1));  
		    System.out.println(m.group(1));
		}      	  
	}
}

 

 表达式查找t和n之间包含0到3个数字的字符串,结果为:

1
t32n 2 5
32
t567n 7 11
567

 可以看到groupCount为1了,同时可以看到group(i),i从1开始代表()内的子表达式,0代表的是整个表达式。

 

正则表达式的语法规则网上有很多,这篇不错:

http://fineboy.cnblogs.com/archive/2005/09/08/232410.html

分享到:
评论

相关推荐

    java正则表达式.zip

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它基于模式匹配的概念,能够高效地进行文本搜索、替换和解析。在Java中,正则表达式主要通过`java.util.regex`包来实现,提供了Pattern和Matcher两个核心...

    Java根据正则表达式生成字符串—Xeger,automaton

    在Java中,`java.util.regex` 包提供了Pattern和Matcher类来处理正则表达式。然而,对于生成符合正则表达式的字符串,标准库并不提供直接支持。这时,我们可以引入第三方库,如`org.pcollections.Xeger` 和 `...

    Java正则表达式 Java 正则表达式

    Java正则表达式是Java语言中用于处理字符串的强大工具,它允许程序员进行复杂的字符串匹配、查找和替换操作。正则表达式(Regular Expression)是一种模式匹配语言,通过特定的语法来描述字符串的模式,用于在文本中...

    使用Java正则表达式分析处理日志

    本篇将围绕“使用Java正则表达式分析处理日志”这一主题,探讨如何利用Java的正则表达式功能来提取、过滤和操作日志数据。 首先,我们需要理解正则表达式的基本概念。正则表达式(Regular Expression)是一种模式...

    java正则表达式匹配工具

    Java正则表达式匹配工具是IT领域中一种强大的文本处理工具,它利用正则表达式(Regular Expression)的规则来查找、替换或者提取文本中的特定模式。正则表达式是一种特殊的字符序列,能够帮助程序员或者用户高效地...

    JAVA正则表达式大全

    在IT领域,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它用于匹配、查找、替换和分析字符串。在Java编程语言中,正则表达式被广泛应用于数据验证、文本提取和字符串操作。以下是对这些...

    java_zhengze.rar_正则表达式_正则表达式 java

    正则表达式是编程语言中用于模式匹配和字符串处理的强大工具,在Java中也不例外。Java的正则表达式功能强大,可以用于验证输入、提取信息、替换文本等多种场景。本资料"java_zhengze.rar"提供了对Java正则表达式的...

    Java正则表达式.ppt

    Java正则表达式是一种强大的文本处理工具,广泛用于验证字符串、查找特定模式和替换文本。在Java中,正则表达式提供了简洁而灵活的方式来处理字符串,使得编程人员能够以更高效的方式实现各种文本操作。 正则表达式...

    常用java正则表达式

    ### 常用Java正则表达式知识点 #### 一、引言 正则表达式是一种强大的工具,用于处理文本并查找模式。多种编程语言,包括Perl、PHP、Python、JavaScript以及Java等均内置了对正则表达式的支持。本文将详细介绍Java...

    使用Java正则表达式实现一个简单的身份证号码验证

    ### 使用Java正则表达式实现一个简单的身份证号码验证 #### 一、背景介绍 身份证号码是中国公民的身份标识,由15位或18位数字组成(早期为15位,后改为18位)。其中,第18位是校验码,可能是数字0~9或者大写字母X。...

    Java 用正则表达式作文本处理

    在这个场景中,我们关注的是如何使用Java结合正则表达式进行文本处理。正则表达式(Regular Expression)是一种模式匹配工具,能够有效地在文本中查找、替换或提取特定的字符串。 Java中对正则表达式的支持主要体现...

    PB实现的正则表达式

    在IT领域,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它能够进行复杂的模式匹配、查找、替换等操作。在本话题中,我们将探讨如何使用PowerBuilder 11.5这一经典的开发环境来实现正则...

    Java JS正则表达式大全

    Java和JavaScript虽然源自不同的语言家族,但在处理正则表达式时,它们有诸多相似之处。本篇文章将详细介绍Java和JavaScript中的正则表达式,帮助读者深入理解这一关键概念。 首先,我们来看Java中的正则表达式。在...

    java 正则表达式应用jar包 regex-smart.jar

    `regex-smart.jar`这个库显然是为了简化开发者在Java项目中使用正则表达式的流程,它提供了一系列内置的验证、提取和清洗方法,使得处理字符串变得更加高效和便捷。 首先,让我们了解一下正则表达式的基础概念。...

    详解Java判断是否是整数,小数或实数的正则表达式

    在Java中使用正则表达式来判断字符串是否符合整数、小数或实数的格式是一种常见且有效的做法。在编程中,我们经常需要对输入的字符串进行格式验证,以确保它们符合预期的数值格式,尤其是在处理财务数据、用户输入...

    常用正则表达式HTML,JAVA合集

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、数据提取等IT领域。在这个“常用正则表达式HTML,JAVA合集”中,我们主要关注的是HTML和Java环境下的正则...

    java-正则表达式-分组引用介绍

    正则表达式是计算机科学中一种非常强大的文本处理工具,在Java等编程语言中广泛应用于字符串匹配、搜索替换等场景。当需要对正则表达式的部分结果进行进一步处理时(如重复使用或修改),可以通过分组来实现这一目标...

    java正则表达式使用例子

    首先,我们需要了解Java中处理正则表达式的`Pattern`和`Matcher`类。`Pattern`类代表一个正则表达式模式,它被编译后用于创建`Matcher`对象。`Matcher`类则提供了多种方法来执行匹配操作,如`matches()`、`find()`和...

    正则表达式自动生成器 V2.0.0.1 官方多语版

    在IT领域,正则表达式是进行文本处理、数据验证和搜索替换等任务的必备技能。 正则表达式(Regular Expression)是一种模式匹配语言,通过预定义的规则来识别和操作字符串。它由一系列特殊字符和组合构成,可以用来...

Global site tag (gtag.js) - Google Analytics