原来,group是针对()来说的,group(0)就是指的整个串,group(1) 指的是第一个括号里的东西,group(2)指的第二个括号里的东西。
最近学习正则表达式,发现Java中的一些术语与其他地方描述的有所差异。比如Java正则表达式中的“组”概念与《正则表达式必知必会》一书中讲述的“子表达式”其实是一样的,只是表述不同而已。由此也引发了使用JavaAPI时对group(int group)、start(int group)、end(int group)不是太理解。在阅读了关于正则表达式问题:有谁用过Matcher类的group()方法没有 之后彻底明白,并写了一个小程序测试。
程序如下
Java代码
- package cn.mingyuan.regexp.singlecharacter;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- public class GroupIndexAndStartEndIndexTest {
- /**
- * @param args
- */
- public static void main(String[] args) {
- // TODO Auto-generated method stub
- String str = "Hello,World! in Java.";
- Pattern pattern = Pattern.compile("W(or)(ld!)");
- Matcher matcher = pattern.matcher(str);
- while(matcher.find()){
- System.out.println("Group 0:"+matcher.group(0));//得到第0组——整个匹配
- System.out.println("Group 1:"+matcher.group(1));//得到第一组匹配——与(or)匹配的
- System.out.println("Group 2:"+matcher.group(2));//得到第二组匹配——与(ld!)匹配的,组也就是子表达式
- System.out.println("Start 0:"+matcher.start(0)+" End 0:"+matcher.end(0));//总匹配的索引
- System.out.println("Start 1:"+matcher.start(1)+" End 1:"+matcher.end(1));//第一组匹配的索引
- System.out.println("Start 2:"+matcher.start(2)+" End 2:"+matcher.end(2));//第二组匹配的索引
- System.out.println(str.substring(matcher.start(0),matcher.end(1)));//从总匹配开始索引到第1组匹配的结束索引之间子串——Wor
- }
- }
- }
程序的运行结果为:
Java代码
- Group 0:World!
- Group 1:or
- Group 2:ld!
- Start 0:6 End 0:12
- Start 1:7 End 1:9
- Start 2:9 End 2:12
- Wor
总结:其实group(),start(),end()所带的参数i就是正则表达式中的子表达式索引(第几个子表达式),由于刚开始对Java正则表达式中的组的概念不清晰,导致理解困难。当将“组”的概念与“子表达式”对应起来之后,理解matcher的group,start,end就完全没有障碍了。
相关推荐
Matcher类的group方法是正则表达式中非常关键的一个方法,它用于提取匹配正则表达式的特定分组内容。在正则表达式中,可以通过括号“()”来定义一个分组,group方法可以返回这些分组所匹配到的子字符串。 在本文中...
在Java中,正则表达式主要通过`java.util.regex`包来实现,提供了Pattern和Matcher两个核心类。 **1. Pattern类** Pattern类是Java正则表达式的起点,它将一个正则表达式编译成一个模式对象。这个编译过程可以优化...
3. **匹配方法**:Matcher提供了`matches()`、`find()`、`lookingAt()`等方法来检查字符串是否符合正则表达式。 4. **替换方法**:`replaceAll()`、`replaceFirst()`用于替换字符串中匹配的部分。 5. **分组与捕获**...
- **`Pattern` 类**:用于编译正则表达式,并提供方法来创建 `Matcher` 对象。 - **`Matcher` 类**:用于执行正则表达式匹配,包括查找字符串中的匹配项、替换匹配项等功能。 示例代码: ```java String text = ...
首先,使用`Pattern.compile(regex)`方法将正则表达式字符串编译成模式对象: ```java Pattern pattern = Pattern.compile("\\d{3}-\\d{2}-\\d{4}"); ``` ##### 执行匹配 接着,使用`matcher()`方法创建一个`...
使用正则表达式匹配文本... 38 向更实用的程序前进... 40 成功匹配的副作用... 40 错综复杂的正则表达式... 43 暂停片刻... 49 使用正则表达式修改文本... 50 例子:公函生成程序... 50 举例:修整股票价格....
总的来说,正则表达式是程序员处理文本的强大工具,理解并掌握其语法和使用方法对于提高文本处理能力至关重要。通过不断实践和学习,你可以利用正则表达式解决各种文本处理问题,无论是在Java还是其他支持正则表达式...
- **Pattern**:用于编译正则表达式,并提供方法来构建Matcher对象。 - **Matcher**:用于执行与输入序列(通常是字符串)的匹配操作。 - **PatternSyntaxException**:当正则表达式语法错误时抛出此异常。 下面是...
在给定的代码中,可以看到如何使用`Pattern.compile()`方法编译正则表达式,如`\\w+`,该正则表达式匹配一个或多个单词字符(字母、数字或下划线)。 在`Matches`类中,`Matcher.find()`方法被用来在输入字符串中...
正则表达式的学习需要对元字符、量词、预查、后向引用等概念有深入理解,同时掌握Java中`Pattern`和`Matcher`的使用方法,结合实际案例进行实践,才能灵活运用到实际项目中。在处理字符串相关问题时,熟练掌握正则...
Java正则表达式是编程语言Java中用于处理文本的强大工具,它允许开发人员根据特定模式匹配、搜索和替换文本。...随着经验的增长,还可以深入学习更复杂的正则表达式构造和高级用法,提升文本处理能力。
Java使用正则表达式提取XML节点内容的方法示例 Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作...
编译正则表达式的过程可以使用 Pattern 类的 compile 方法。例如: ```java Pattern p = Pattern.compile("a*b"); ``` 这将编译正则表达式 "a*b" 并将其编译成 Pattern 对象。 三、matcher 方法 在编译正则...
1. **编译正则表达式**:使用`Pattern.compile()`方法创建一个`Pattern`对象,例如`Pattern pattern = Pattern.compile("你的正则表达式")`。 2. **创建Matcher对象**:使用`Pattern`对象的`matcher()`方法,传入...
例如,你可以创建Pattern对象,编译正则表达式,然后使用Matcher对象进行匹配和查找操作。Matcher类提供了诸如`find()`、`matches()`和`group()`等方法,用于在文本中查找匹配项并提取分组信息。 总的来说,Java...
- **预编译模式**:使用`Pattern.compile()`预编译正则表达式可以提高性能。 - **回溯控制**:使用`\G`匹配上次匹配后的位置,或使用`(?<=...)`正向后看,`(?<!...)`负向后看,优化匹配过程。 - **非贪婪匹配**:...
- `Pattern.compile(String regex)`:这是编译正则表达式的基本方法,将字符串转换为`Pattern`对象。 - `Pattern.flags(int flags)`:可以设置一些标志,例如忽略大小写(`CASE_INSENSITIVE`)或多行模式(`...
#### 三、正则表达式的使用方法 在Java中,可以通过两种主要的方式来使用正则表达式: 1. **String类的matches方法** - **语法**:`boolean matches(String regex)` - **作用**:检查当前字符串是否符合指定的...
总的来说,正则表达式是Java编程中不可或缺的一部分,熟练掌握其用法可以提高代码的效率和可读性。测试正则表达式的软件是开发者的好帮手,它们提供了一个友好的界面来实践和调试正则表达式,使得这个过程变得更加...