`

Java正则表达式实例详解-续

阅读更多

匹配的模式(Pattern flags)

compile( )方法还有一个版本,它需要一个控制正则表达式的匹配行为的参数:

Pattern Pattern.compile(String regex, int flag)

flag的取值范围如下:

编译标志效果
Pattern.CANON_EQ 当且仅当两个字符的"正规分解(canonical decomposition)"都完全相同的情况下,才认定匹配。比如用了这个标志之后,表达式"a\u030A"会匹配"?"。默认情况下,不考虑"规范相等性(canonical equivalence)"。
Pattern.CASE_INSENSITIVE
(?i)
默认情况下,大小写不明感的匹配只适用于US-ASCII字符集。这个标志能让表达式忽略大小写进行匹配。要想对Unicode字符进行大小不明感的匹配,只要将UNICODE_CASE与这个标志合起来就行了。
Pattern.COMMENTS
(?x)
在这种模式下,匹配时会忽略(正则表达式里的)空格字符(译者注:不是指表达式里的"\\s",而是指表达式里的空格,tab,回车之类)。注释从#开始,一直到这行结束。可以通过嵌入式的标志来启用Unix行模式。
Pattern.DOTALL
(?s)
在这种模式下,表达式'.'可以匹配任意字符,包括表示一行的结束符。默认情况下,表达式'.'不匹配行的结束符。
Pattern.MULTILINE
(?m)
在这种模式下,'^'和'$'分别匹配一行的开始和结束。此外,'^'仍然匹配字符串的开始,'$'也匹配字符串的结束。默认情况下,这两个表达式仅仅匹配字符串的开始和结束。
Pattern.UNICODE_CASE
(?u)
在这个模式下,如果你还启用了CASE_INSENSITIVE标志,那么它会对Unicode字符进行大小写不明感的匹配。默认情况下,大小写不明感的匹配只适用于US-ASCII字符集。
Pattern.UNIX_LINES
(?d)
在这个模式下,只有'\n'才被认作一行的中止,并且与'.','^',以及'$'进行匹配。

在这些标志里面,Pattern.CASE_INSENSITIVEPattern.MULTILINE,以及Pattern.COMMENTS是最有用的(其中Pattern.COMMENTS还能帮我们把思路理清楚,并且/或者做文档)。注意,你可以用在表达式里插记号的方式来启用绝大多数的模式。这些记号就在上面那张表的各个标志的下面。你希望模式从哪里开始启动,就在哪里插记号。

可以用"OR" ('|')运算符把这些标志合使用:

//: c12:ReFlags.java
import java.util.regex.*;
import com.bruceeckel.simpletest.*;
public class ReFlags {
  private static Test monitor = new Test();
  public static void main(String[] args) {
    Pattern p =  Pattern.compile("^java",
      Pattern.CASE_INSENSITIVE | Pattern.MULTILINE);
    Matcher m = p.matcher(
      "java has regex\nJava has regex\n" +
      "JAVA has pretty good regular expressions\n" +
      "Regular expressions are in Java");
    while(m.find())
      System.out.println(m.group());
    monitor.expect(new String[] {
      "java",
      "Java",
      "JAVA"
    });
  }
} ///:~

这样创建出来的正则表达式就能匹配以"java","Java","JAVA"...开头的字符串了。此外,如果字符串分好几行,那它还会对每一行做匹配(匹配始于字符序列的开始,终于字符序列当中的行结束符)。注意,group( )方法仅返回匹配的部分。

split( )

所谓分割是指将以正则表达式为界,将字符串分割成String数组。

String[] split(CharSequence charseq)
String[] split(CharSequence charseq, int limit)

这是一种既快又方便地将文本根据一些常见的边界标志分割开来的方法。

//: c12:SplitDemo.java
import java.util.regex.*;
import com.bruceeckel.simpletest.*;
import java.util.*;
public class SplitDemo {
  private static Test monitor = new Test();
  public static void main(String[] args) {
    String input =
      "This!!unusual use!!of exclamation!!points";
    System.out.println(Arrays.asList(
      Pattern.compile("!!").split(input)));
    // Only do the first three:
    System.out.println(Arrays.asList(
      Pattern.compile("!!").split(input, 3)));
    System.out.println(Arrays.asList(
      "Aha! String has a split() built in!".split(" ")));
    monitor.expect(new String[] {
      "[This, unusual use, of exclamation, points]",
      "[This, unusual use, of exclamation!!points]",
      "[Aha!, String, has, a, split(), built, in!]"
    });
  }
} ///:~
分享到:
评论

相关推荐

    java正则表达式.zip

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它基于模式匹配的概念,能够高效地进行文本搜索、替换和解析。在Java中,正则表达式主要通过`java.util.regex`包来实现,提供了Pattern和Matcher两个核心...

    Java正则表达式详解(非常适合入门

    ### Java正则表达式详解 #### 一、正则表达式的重要性及应用 正则表达式,作为一种强大的文本处理工具,对于程序员而言是不可或缺的基本技能之一。它在文本的匹配、搜索和替换等方面发挥着不可替代的作用。尤其在...

    Java中的正则表达式 -- 示例详解

    Java中的正则表达式是程序开发中处理字符串匹配、查找、替换和判断的强大工具,尤其在处理复杂的文本操作时,正则表达式能显著提高效率。自Java 1.4引入`java.util.regex`包以来,Java程序员可以方便地利用正则...

    java正则表达式详解(PDF)

    通过这份"java正则表达式详解(PDF)"文档,读者将能深入了解Java正则表达式的各个方面,掌握如何在实际项目中有效地运用正则表达式进行字符串处理。无论你是Java初学者还是经验丰富的开发者,这份资料都将是一份...

    JAVA正则表达式实例教程

    ### JAVA正则表达式实例教程 #### 一、正则表达式基础知识 ##### 1.1 什么是正则表达式? 正则表达式是一种强大的文本处理工具,它能够帮助我们进行复杂的文本匹配、查找和替换等工作。正则表达式本质上是由一...

    java正则表达式及例子 pdf

    二、Java正则表达式实例 1. 验证邮箱格式: ```java String pattern = "^[\\w\\.-]+@([\\w\\-]+\\.)+[\\w\\-]{2,4}$"; ``` 这个模式用于检查输入的字符串是否符合电子邮件地址的基本格式。 2. 提取URL: ```...

    java正则表达式详解

    ### Java正则表达式详解 #### 一、正则表达式基础知识 正则表达式是一种强大的文本处理工具,能够帮助开发者高效地完成字符串的搜索、替换等操作。下面详细介绍正则表达式的几个基本元素。 ##### 1.1 句点符号(`...

    java正则表达式实例(邮箱,车牌,密码,url,IP,身份证,车牌等等)

    ### Java正则表达式实例详解 #### 一、概述 正则表达式是一种强大的文本处理工具,能够帮助我们在字符串中查找、替换或提取特定模式的数据。在Java编程中,正则表达式的应用非常广泛,例如在表单验证、数据清洗等...

    java正则表达式实例教程

    ### Java正则表达式实例教程知识点详解 #### 一、正则表达式基础知识 1. **定义** - 正则表达式(Regular Expression)是一种强大的文本处理工具,能够帮助我们快速查找、替换以及提取符合特定模式的字符串。 2....

    java正则表达式入门详解

    Java正则表达式是Java语言中用于处理文本模式匹配的重要工具,它源于早期的神经网络研究和计算机搜索算法。在Java中,正则表达式提供了一种简洁且强大的方式来查找、替换或提取字符串中的模式。尽管许多其他编程语言...

    Java正则表达式详解.pdf

    ### Java正则表达式详解 #### 一、正则表达式简介 正则表达式(Regular Expression)是一种用于模式匹配和替换的强大工具。它由普通字符(如a-z)及特殊字符(称为元字符)组成,能够描述在查找文本主体时待匹配的...

    Java正则表达式详解(包含实例说明)

    Java正则表达式是Java语言中用于处理文本和匹配模式的重要工具。虽然在撰写此文章时,Java规范需求中正则表达式的支持还未被正式纳入JDK,但开发者可以通过Apache的Jakarta-ORO库来实现正则表达式功能。 正则表达式...

Global site tag (gtag.js) - Google Analytics