`
uule
  • 浏览: 6352209 次
  • 性别: Icon_minigender_1
  • 来自: 一片神奇的土地
社区版块
存档分类
最新评论

正则表达式基础

 
阅读更多

 

一个正则表达式,必须首先要编译成为一个Pattern类的实例,这个Pattern对象将会使用matcher()方法来生成一个Matcher实例,接着便可以使用该 Matcher实例以编译的正则表达式为基础对目标字符串进行匹配工作,多个Matcher是可以共用一个Pattern对象的。
 最强日期正则表达式

//javascript 的正则表达式

var regex = new  RegExp( "\\[([^\\[^\\]]+)\\((\\d{1,6})\\)\\]" ,  "g" );   
if (!regExp.test(layer.value))	

 //JAVA中正则表达式

//判断数字
public static boolean isNumeric(String str){
	    Pattern pattern = Pattern.compile("[0-9]*");
	    return pattern.matcher(str).matches();   
	 } 

 

Pattern p = Pattern.compile("\\d");
Matcher matcher = p.matcher("5");
boolean isOk = matcher.matches();
   System.out.println(isOk);  //true

 // recycle the pattern
String tmp = p.pattern();
    System.out.println(tmp); //  \d
Pattern p2 = Pattern.compile(tmp);
matcher = p.matcher("5");

 

 Matcher类:
    使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的.


public String group()
返回由以前匹配操作所匹配的输入子序列。
这个方法提供了强大而方便的工具,他可以等同使用start和end,然后对字符串作substring(start,end)操作。
public String group(int group)
这个方法提供了强大而方便的工具,可以得到指定的group所匹配的输入字符串

(1).
下面我们看看一个小例子,来说明这个问题

\w(\d\d)(\w+)

这个正则表达式有三个组:
整个\w(\d\d)(\w+) 是第0组 group(0)
(\d\d)是第1组 group(1)
(\w+)是第2组 group(2)

我们看看和正则表达式匹配的一个字符串x99SuperJava,
group(0)是匹配整个表达式的字符串的那部分x99SuperJava
group(1)是第1组(\d\d)匹配的部分:99
group(2)是第二组(\w+)匹配的那部分SuperJava
下面我们写一个程序来验证一下:

 

String regex = "\\w(\\d\\d)(\\w+)";
String candidate = "x99SuperJava";
		
Pattern p = Pattern.compile(regex);
Matcher matcher = p.matcher(candidate);
if(matcher.find()){
     int gc = matcher.groupCount();
     for(int i = 0; i <= gc; i++)
	System.out.println("group " + i + ": " + matcher.group(i));
 }
System.out.println(p.pattern());

 

结果:
group 0: x99SuperJava
group 1: 99
group 2: SuperJava
\w(\d\d)(\w+)

 

 

(2)

 

Pattern p = Pattern.compile("B(ond)");
	    String candidateString = "My name is Bond. James Bond.";
	    Matcher matcher = p.matcher(candidateString);
	    matcher.find();
	    String group_0 = matcher.group(0);
	    String group_1 = matcher.group(1);
	    System.out.println("Group 0 : " + group_0);
	    System.out.println("Group 1 : " + group_1);
	    System.out.println(candidateString);
	     //Find group number 1 of the second find
	    matcher.find();
	    group_0 = matcher.group(0);
	    group_1 = matcher.group(1);
	    System.out.println("Group 0 : " + group_0);
	    System.out.println("Group 1 : " + group_1);
	    System.out.println(candidateString);

 

结果:
Group 0 : Bond
Group 1 : ond
My name is Bond. James Bond.
Group 0 : Bond
Group 1 : ond
My name is Bond. James Bond.


public Pattern pattern()
这个方法返回了,创建Matcher的那个pattern对象。

public Matcher reset()
这个方法将Matcher的状态重新设置为最初的状态。
public Matcher reset(CharSequence input)
重新设置Matcher的状态,并且将候选字符序列设置为input后进行Matcher, 这个方法和重新创建一个Matcher一样,只是这样可以重用以前的对象。

 

String candidateString = "My name is Bond. James Bond.";
	    Pattern p = Pattern.compile("Bond");
	    Matcher matcher = p.matcher(candidateString);
	       //Find the starting point of the first 'Bond'
	    matcher.find();
	    int startIndex = matcher.start();
	    System.out.println(startIndex);  // 11
	       //Find the starting point of the second 'Bond'
	    matcher.find();
	    int nextIndex = matcher.start();
	    System.out.println(nextIndex);  // 23

   

public int start()
这个方法返回了,Matcher所匹配的字符串在整个字符串的的开始下标:
public int end()
这个和start()对应,返回在以前的匹配操作期间,由给定组所捕获子序列的最后字符之后的偏移量。
其实start和end经常是一起配合使用来返回匹配的子字符串。


public boolean matches()
尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。
和find不同, find是会在整个输入字符串查找匹配的子字符串。
public boolean find()
find会在目标字符串中寻找是否有匹配的子字符串,一般我们使用find的流程:
尝试在目标字符串里查找下一个匹配子串。

 while(matcher.find()){
    //在匹配的区域,使用group,replace等进行查看和替换操作
 }

public boolean find(int start)
从输入字符串指定的start位置开始查找。


 来源参考:

http://www.java3z.com/cwbwebhome/article/article8/81313.html?id=3138

http://www.jspcn.net/htmlnews/600100423.html

分享到:
评论

相关推荐

    Python正则表达式基础

    Python正则表达式基础是学习如何在Python中应用正则表达式的入门指南。正则表达式,或称为REs、regexes、regexpatterns,是能够嵌入到Python中的一个精细、高度专业化的程序语言。通过re模块,程序员得以使用这一...

    vb正则表达式实例(正则表达式测试程序)

    1. 正则表达式基础 - **模式匹配**:正则表达式是一种特殊的字符序列,用于定义字符串的搜索模式。 - **元字符**:如 `.`(任意单个字符)、`*`(零个或多个前面的字符)、`+`(一个或多个前面的字符)、`?`(零个...

    groovy正则表达式基础1

    【Groovy正则表达式基础1】 Groovy是一种基于Java平台的动态编程语言,它扩展了Java的功能,包括对正则表达式的处理。在Groovy中,正则表达式是通过`~`运算符或者使用斜杠(`/`)来定义的。这种特性使得Groovy在处理...

    正则表达式测试工具C#版(src)

    1. **C#中的正则表达式基础** - `System.Text.RegularExpressions`命名空间:C#中的正则表达式操作主要基于这个命名空间下的类和方法。 - `Regex`类:这是处理正则表达式的核心类,提供了多种与正则相关的静态方法...

    易语言正则表达式文本替换

    1. **正则表达式基础** - **元字符**:如`.`表示任意字符,`^`表示行首,`$`表示行尾,`\d`代表数字,`\w`代表字母或数字,`\s`代表空白字符。 - **量词**:如`*`表示前面的元素零次或多次,`+`表示一次或多次,`?...

    精通正则表达式(第三版)简体中文版

    ### 正则表达式基础知识与应用 #### 一、正则表达式的定义及用途 正则表达式(Regular Expression)是一种强大的文本处理工具,能够帮助用户查找、替换以及操作特定的字符串或字符组合。它在多种编程语言和操作...

    通过正则表达式生成数据

    一、正则表达式基础 1. **基本元素**:正则表达式由一系列字符和特殊符号组成,如字母、数字、特殊字符以及元字符(如`.`、`*`、`+`、`?`、`^`、`$`、`|`、`()`、`[]`、`\`等)。 2. **量词**:`*`表示零个或多个...

    正则表达式基础学习笔记

    正则表达式(Regular Expression,简称regex)是用于...通过熟练掌握上述基础知识,你将能够编写出高效且精准的正则表达式,大大提高文本处理的效率。在实际应用中,不断实践和积累经验,是成为正则表达式高手的关键。

    测试正则表达式软件

    首先,让我们了解一下Java中的正则表达式基础。在Java中,`java.util.regex`包提供了对正则表达式的支持。主要涉及以下核心类: 1. **Pattern**:表示一个正则表达式模式,可以通过`Pattern.compile(String regex)`...

    01C#正则表达式基础教程.doc

    **正则表达式基础教程** 1. **本文目标** 本教程旨在为C#开发者提供正则表达式的基础知识,帮助理解正则表达式的概念、语法和常见用途。通过学习,你将能够编写和使用正则表达式进行文本匹配、验证和处理。 2. **...

    vba正则表达式基础

    vba正则表达式基础知识介绍,由浅入深,实例讲解

    详细的C#正则表达式基础教程

    本教程将深入探讨C#中的正则表达式基础,帮助你掌握这一核心技能。 1. **正则表达式简介** 正则表达式(Regular Expression)是一种模式匹配语言,用于在字符串中查找、替换或捕获特定模式。它通过一套特殊语法来...

    Java使用正则表达式提取XML节点内容的方法示例

    但是,正则表达式也是一种非常复杂的技术,需要开发者具备一定的基础知识和经验。 为了帮助开发者更好地掌握Java正则表达式技术,我们提供了一系列的Java正则表达式技巧大全,包括《Java正则表达式技巧大全》、...

    第11.25节 Python正则表达式编译re.compile及正则对象使用.rar

    ### 正则表达式基础 正则表达式(Regular Expression)是一种特殊的字符串序列,用于描述一种模式。在Python中,`re`模块提供了对正则表达式的支持。正则表达式的基本元素包括: 1. 字符匹配:如`.`匹配任意单个...

    C#字符串和正则表达式参考手册

    1. 正则表达式基础:正则表达式是一种模式匹配工具,用于在字符串中搜索、替换和提取特定模式。 2. 正则表达式对象:在C#中,使用`System.Text.RegularExpressions`命名空间下的`Regex`类来处理正则表达式。 3. ...

    正则表达式基础正则表达式基础

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、搜索和替换...在“正则表达式基础.ppt”这个文件中,应该包含了更详细的讲解,可以帮助你深入理解这一主题。

    IP地址的正则表达式

    ### 正则表达式基础 正则表达式是一种强大的文本处理工具,主要用于字符串搜索、替换以及提取等操作。通过特定的字符组合,正则表达式能够匹配符合某种模式的字符串。在处理IP地址时,正则表达式可以帮助我们验证一...

    使用正则表达式拆分字符串

    1. 正则表达式基础 - **模式匹配**:正则表达式由一系列字符和特殊符号组成,用于定义一个模式,该模式可以匹配特定的字符串。 - **元字符**:如`*`, `+`, `?`, `{}`, `[]`, `\`等,它们具有特殊的含义,用于指定...

    delphi xe 10 正则表达式

    一、正则表达式基础 正则表达式(Regular Expression)是一种特殊的字符串模式,用于在文本中搜索匹配该模式的字符串。它们由一系列字符和特殊符号组成,这些符号代表了不同的匹配规则。例如,`\d`表示任何数字,`^...

Global site tag (gtag.js) - Google Analytics