`
xifangyuhui
  • 浏览: 188573 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

学习正则表达式:Matcher类

阅读更多

Matcher类: 
    使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的. 

下面我们看看一个小例子,来说明这个问题 

\w(\d\d)(\w+)


这个正则表达式有三个组: 
整个\w(\d\d)(\w+) 是第0组 group(0) 
(\d\d)是第1组 group(1) 
(\w+)是第2组 group(2) 

   我们看看和正则表达式匹配的一个字符串x99SuperJava, 
group(0)是匹配整个表达式的字符串的那部分x99SuperJava 
group(1)是第1组(\d\d)匹配的部分:99 
group(2)是第二组(\w+)匹配的那部分SuperJava

 

下面我们写一个程序来验证一下: 

package edu.jlu.fuliang;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegexTest {
	public static void main(String[] args) {
		String regex = "\\w(\\d\\d)(\\w+)";
		String candidate = "x99SuperJava";
		
		Pattern p = Pattern.compile(regex);
		Matcher matcher = p.matcher(candidate);
		if(matcher.find()){
			int gc = matcher.groupCount();
			for(int i = 0; i <= gc; i++)
				System.out.println("group " + i + " :" + matcher.group(i));
		}
	}
}
                  

输出结果: 

引用
group 099SuperJava 
group 1 :99 
group 2 :SuperJava



下面我们看看Matcher类提供的方法: 
public Pattern pattern() 
这个方法返回了,创建Matcher的那个pattern对象。 

下面我们看看一个小例子来说明这个结果 

import java.util.regex.*;
public class MatcherPatternExample{
  public static void main(String args[]){
      test();
  }
  public static void test(){
     Pattern p = Pattern.compile("\\d");
     Matcher m1 = p.matcher("55");
     Matcher m2 = p.matcher("fdshfdgdfh");
     System.out.println(m1.pattern() == m2.pattern());
     //return true
  }
}
   

public Matcher reset() 
这个方法将Matcher的状态重新设置为最初的状态。 

public Matcher reset(CharSequence input) 
重新设置Matcher的状态,并且将候选字符序列设置为input后进行Matcher, 这个方法和重新创建一个Matcher一样,只是这样可以重用以前的对象。 

public int start() 
这个方法返回了,Matcher所匹配的字符串在整个字符串的的开始下标: 
下面我们看看一个小例子 

public class MatcherStartExample{
  public static void main(String args[]){
      test();
  }
  public static void test(){
     //create a Matcher and use the Matcher.start() method
     String candidateString = "My name is Bond. James Bond.";
     String matchHelper[] =
      {"          ^","                      ^"};
     Pattern p = Pattern.compile("Bond");
     Matcher matcher = p.matcher(candidateString);
     //Find the starting point of the first 'Bond'
      matcher.find();
      int startIndex = matcher.start();
      System.out.println(candidateString);
      System.out.println(matchHelper[0] + startIndex);
     //Find the starting point of the second 'Bond'
      matcher.find();
      int nextIndex = matcher.start();
      System.out.println(candidateString);
      System.out.println(matchHelper[1] + nextIndex);
}
                  


输出结果: 
My name is Bond. James Bond. 
          ^11 
My name is Bond. James Bond. 
                      ^23 

public int start(int group) 
这个方法可以指定你感兴趣的sub group,然后返回sup group匹配的开始位置。 

public int end() 
这个和start()对应,返回在以前的匹配操作期间,由给定组所捕获子序列的最后字符之后的偏移量。 
其实start和end经常是一起配合使用来返回匹配的子字符串。 

public int end(int group) 
和public int start(int group)对应,返回在sup group匹配的子字符串最后一个字符在整个字符串下标加一 

public String group() 
返回由以前匹配操作所匹配的输入子序列。 
这个方法提供了强大而方便的工具,他可以等同使用start和end,然后对字符串作substring(start,end)操作。 
看看下面一个小例子: 

import java.util.regex.*;
public class MatcherGroupExample{
  public static void main(String args[]){
      test();
  }
  public static void test(){
      //create a Pattern
      Pattern p = Pattern.compile("Bond");
      //create a Matcher and use the Matcher.group() method
      String candidateString = "My name is Bond. James Bond.";
      Matcher matcher = p.matcher(candidateString);
      //extract the group
      matcher.find();
      System.out.println(matcher.group());
  }
}


public String group(int group) 
这个方法提供了强大而方便的工具,可以得到指定的group所匹配的输入字符串 
因为这两个方法经常使用,同样我们看一个小例子: 

import java.util.regex.*;
public class MatcherGroupParamExample{
  public static void main(String args[]){
      test();
  }
  public static void test(){
     //create a Pattern
      Pattern p = Pattern.compile("B(ond)");
     //create a Matcher and use the Matcher.group(int) method
     String candidateString = "My name is Bond. James Bond.";
     //create a helpful index for the sake of output
     Matcher matcher = p.matcher(candidateString);
     //Find group number 0 of the first find
      matcher.find();
      String group_0 = matcher.group(0);
      String group_1 = matcher.group(1);
      System.out.println("Group 0 " + group_0);
      System.out.println("Group 1 " + group_1);
      System.out.println(candidateString);
     //Find group number 1 of the second find
      matcher.find();
      group_0 = matcher.group(0);
      group_1 = matcher.group(1);
      System.out.println("Group 0 " + group_0);
      System.out.println("Group 1 " + group_1);
      System.out.println(candidateString);
  }
}


public int groupCount() 

这个方法返回了,正则表达式的匹配的组数。 



public boolean matches() 

尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。 

和find不同, find是会在整个输入字符串查找匹配的子字符串。 

public boolean find() 

find会在整个输入中寻找是否有匹配的子字符串,一般我们使用find的流程: 
 while(matcher.find()){
    //在匹配的区域,使用group,replace等进行查看和替换操作
 }

public boolean find(int start) 
从输入字符串指定的start位置开始查找。 

public boolean lookingAt() 
基本上是matches更松约束的一个方法,尝试将从区域开头开始的输入序列与该模式匹配 

public Matcher appendReplacement (StringBuffer sb, String replacement) 
你想把My name is Bond. James Bond. I would like a martini中的Bond换成Smith 

StringBuffer sb = new StringBuffer();
String replacement = "Smith";
Pattern pattern = Pattern.compile("Bond");
Matcher matcher =pattern.matcher("My name is Bond. James Bond. I would like a martini.");
while(matcher.find()){
  matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith
}

Matcher对象会维护追加的位置,所以我们才能不断地使用appendReplacement来替换所有的匹配。 

public StringBuffer appendTail(StringBuffer sb) 
这个方法简单的把为匹配的结尾追加到StringBuffer中。在上一个例子的最后再加上一句: 
matcher.appendTail(sb); 
结果就会成为My name is Smith. James Smith. I would like a martini. 

public String replaceAll(String replacement) 
这个是一个更方便的方法,如果我们想替换所有的匹配的话,我们可以简单的使用replaceAll就ok了。 
是: 

while(matcher.find()){
  matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith
}
matcher.appendTail(sb);

的更便捷的方法。 

public String replaceFirst(String replacement)

这个与replaceAll想对应很容易理解,就是只替换第一个匹配的。

分享到:
评论

相关推荐

    详解正则表达式Matcher类中group方法

    在Java中,正则表达式相关的操作主要集中在java.util.regex包中,主要包括两个类:Pattern类与Matcher类。Pattern类用于编译正则表达式模式,而Matcher类则用于对输入字符串进行模式匹配。 Matcher类的group方法是...

    Java正则表达式:Pattern类和Matcher类

    Java正则表达式:Pattern类和Matcher类

    PB实现的正则表达式

    在压缩包中的"PbRegeXP"文件可能是作者提供的一个示例代码或库,包含了实现正则表达式的类、函数或其他组件。通过研究这个文件,开发者可以了解如何在PowerBuilder 11.5中构建自己的正则表达式解决方案。 在Power...

    java正则表达式: regular expression(一)

    Java提供了`java.util.regex`包,其中包含`Pattern`、`Matcher`和`PatternSyntaxException`等类来支持正则表达式操作。 1. **Pattern类**:这是正则表达式的模板,可以编译成一个`Pattern`对象。编译的过程主要是将...

    精通正则表达式基于.NET ASP PHP JSP JavaScript

    RegexApplication/Default.aspx 正则表达式类的应用 RegexApplication/GetPageHtmlData.aspx 获取网页的内容 第10章(/10/) ASPNETValidator/Compare.aspx 比较验证 ASPNETValidator/...

    Java使用正则表达式提取XML节点内容的方法示例

    Java使用正则表达式提取XML节点内容的方法示例 Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作...

    正则表达式综合练习

    10. **编程语言支持**:大多数编程语言都内置了正则表达式支持,如Java(Test.java中的例子可能涉及Java的`Pattern`和`Matcher`类),Python的`re`模块,JavaScript的`match`、`replace`等方法。 11. **优化技巧**...

    java正则表达式.zip

    在Java中,正则表达式主要通过`java.util.regex`包来实现,提供了Pattern和Matcher两个核心类。 **1. Pattern类** Pattern类是Java正则表达式的起点,它将一个正则表达式编译成一个模式对象。这个编译过程可以优化...

    java_zhengze.rar_正则表达式_正则表达式 java

    本资料"java_zhengze.rar"提供了对Java正则表达式的详细讲解,包括基本概念、元字符、预定义字符类以及各种匹配操作,对于Java开发者来说是一份非常实用的学习资源。 首先,我们来了解一下正则表达式的基石——元...

    java正则表达式匹配工具

    在Java中,正则表达式的使用主要依赖于`java.util.regex`包中的类,如`Pattern`和`Matcher`。 首先,我们来看`Pattern`类。这个类是正则表达式的模板,负责编译和存储正则表达式。一旦正则表达式被编译为`Pattern`...

    使用Java正则表达式分析处理日志

    Java中的正则表达式主要通过`java.util.regex`包中的类来实现,如`Pattern`和`Matcher`。 在日志处理中,我们通常需要完成以下任务: 1. **过滤日志级别**:日志通常包含不同的级别,如DEBUG、INFO、WARN、ERROR等...

    JAVA正则表达式大全

    正则表达式的学习需要对元字符、量词、预查、后向引用等概念有深入理解,同时掌握Java中`Pattern`和`Matcher`的使用方法,结合实际案例进行实践,才能灵活运用到实际项目中。在处理字符串相关问题时,熟练掌握正则...

    正则表达式学习书PDF

    在实际应用中,正则表达式可以结合编程语言的函数,如JavaScript的`match()`、`replace()`,Python的`re`模块,Java的`Pattern`和`Matcher`类等,实现更复杂的功能。同时,理解正则表达式的性能影响也很重要,过度...

    常用正则表达式HTML,JAVA合集

    Java提供了`java.util.regex`包,通过`Pattern`和`Matcher`类支持正则表达式。以下是如何在Java中验证电话号码的一个例子: ```java import java.util.regex.Pattern; import java.util.regex.Matcher; String...

    详解Java判断是否是整数,小数或实数的正则表达式

    该工具类使用了`java.util.regex`包中的`Pattern`和`Matcher`类来完成正则表达式的编译和匹配工作。以下是几个重要的方法说明: - `isPositiveInteger`:验证是否为正整数。 - `isNegativeInteger`:验证是否为负...

    java使用正则表达式判断手机号的方法示例

    3. Pattern和Matcher类的使用:在java中,Pattern类和Matcher类是用于正则表达式匹配的。Pattern类用于编译正则表达式,而Matcher类用于匹配字符串。 4. Pattern.compile()方法:Pattern.compile()方法用于编译正则...

    使用Java正则表达式实现一个简单的身份证号码验证

    `Pattern`类用于编译正则表达式字符串,而`Matcher`类用于执行与字符串的匹配操作。 #### 三、身份证号码的格式规则 1. **长度**:15位或18位。 2. **前17位**:均为数字。 3. **第18位**: - 对于18位身份证号码...

    java正则表达式详解

    ### Java正则表达式详解 #### 一、正则表达式基础知识 正则表达式是一种强大的文本处理工具,被广泛应用于各种编程语言中,用于文本的查找与替换、验证等场景。Java作为一种主流的编程语言,同样支持正则表达式的...

    测试正则表达式软件

    这对于学习和优化正则表达式非常有帮助,避免了在代码中反复测试的麻烦。 总的来说,正则表达式是Java编程中不可或缺的一部分,熟练掌握其用法可以提高代码的效率和可读性。测试正则表达式的软件是开发者的好帮手,...

Global site tag (gtag.js) - Google Analytics