`
79343654
  • 浏览: 45963 次
  • 性别: Icon_minigender_1
  • 来自: 太原
社区版块
存档分类
最新评论

正则表达式regular expression详述(一)

 
阅读更多

正则表达式是regular expression,看来英文比中文要好理解多了,就是检查表达式符 
不符合规定!!正则表达式有一个功能十分强大而又十分复杂的对象RegExp,在JavaScript1.2 版本以 
上提供。 
下面我们看看有关正则表达式的介绍: 
正则表达式对象用来规范一个规范的表达式(也就是表达式符不符合特定的要求,比如是不是Email 
地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法。 
除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经预先定义好了正则表达式 
对象的静态属性,你可以随时使用它们。 
核心对象: 
在JavaScript 1.2, NES 3.0以上版本提供。 
在JavaScript 1.3以后版本增加了toSource方法。 
建立方法: 
文字格式或RegExp构造器函数。 
文字建立格式使用以下格式: 
/pattern/flags即/模式/标记

构造器函数方法使用方法如下: 
new RegExp("pattern"[, "flags"])即new RegExp("模式"[,"标记"])

参数: 
pattern(模式) 
表示正则表达式的文本

flags(标记) 
如果指定此项,flags可以是下面值之一: 
g: global match(全定匹配) 
i: ignore case(忽略大小写) 
gi: both global match and ignore case(匹配所有可能的值,也忽略大小写)

注意:文本格式中的参数不要使用引号标记,而构造器函数的参数则要使用引号标记。所以下面的 
表达式建立同样的正则表达式: 
/ab+c/i 
   new RegExp("ab+c", "i")

描述: 
当使用构造函数的时候,必须使用正常的字符串避开规则(在字符串中加入前导字符\ )是必须的。 
例如,下面的两条语句是等价的: 
re = new RegExp("\\w+") 
re = /\w+/

下面的提供了在正则表达式中能够使用的完整对特殊字符的一个完整的列表和描述。

表1.3:正则表达式中的特殊字符:

字符\ 
意义:对于字符,通常表示按字面意义,指出接着的字符为特殊字符,\不作解释。 
例如:/b/匹配字符'b',通过在b 前面加一个反斜杠\,也就是/\b/,则该字符变成特殊字符,表示 
匹配一个单词的分界线。 
或者: 
对于几个字符,通常说明是特殊的,指出紧接着的字符不是特殊的,而应该按字面解释。 
例如:*是一个特殊字符,匹配任意个字符(包括0个字符);例如:/a*/意味匹配0个或多个a。 
为了匹配字面上的*,在a前面加一个反斜杠;例如:/a\*/匹配'a*'。

字符^ 
意义:表示匹配的字符必须在最前边。 
例如:/^A/不匹配"an A,"中的'A',但匹配"An A."中最前面的'A'。

字符$ 
意义:与^类似,匹配最末的字符。 
例如:/t$/不匹配"eater"中的't',但匹配"eat"中的't'。

字符* 
意义:匹配*前面的字符0次或n次。 
例如:/bo*/匹配"A ghost booooed"中的'boooo'或"A bird warbled"中的'b',但不匹配"A goat g 
runted"中的任何字符。

字符+ 
意义:匹配+号前面的字符1次或n次。等价于{1,}。 
例如:/a+/匹配"candy"中的'a'和"caaaaaaandy."中的所有'a'。

字符? 
意义:匹配?前面的字符0次或1次。 
例如:/e?le?/匹配"angel"中的'el'和"angle."中的'le'。

字符. 
意义:(小数点)匹配除换行符外的所有单个的字符。 
例如:/.n/匹配"nay, an apple is on the tree"中的'an'和'on',但不匹配'nay'。


字符(x) 
意义:匹配'x'并记录匹配的值。 
例如:/(foo)/匹配和记录"foo bar."中的'foo'。匹配子串能被结果数组中的素[1], ..., [n] 返
回,或被RegExp对象的属性$1, ..., $9返回。

字符x|y 
意义:匹配'x'或者'y'。 
例如:/green|red/匹配"green apple"中的'green'和"red apple."中的'red'。

字符{n} 
意义:这里的n是一个正整数。匹配前面的n个字符。 
例如:/a{2}/不匹配"candy,"中的'a',但匹配"caandy," 中的所有'a'和"caaandy."中前面的两个 
'a'。

字符{n,} 
意义:这里的n是一个正整数。匹配至少n个前面的字符。 
例如:/a{2,}不匹配"candy"中的'a',但匹配"caandy"中的所有'a'和"caaaaaaandy."中的所有'a'

字符{n,m} 
意义:这里的n和m都是正整数。匹配至少n个最多m个前面的字符。 
例如:/a{1,3}/不匹配"cndy"中的任何字符,但匹配 "candy,"中的'a',"caandy," 中的前面两个 
'a'和"caaaaaaandy"中前面的三个'a',注意:即使"caaaaaaandy" 中有很多个'a',但只匹配前面的三 
个'a'即"aaa"。

字符[xyz] 
意义:一字符列表,匹配列出中的任一字符。你可以通过连字符-指出一个字符范围。 
例如:[abcd]跟[a-c]一样。它们匹配"brisket"中的'b'和"ache"中的'c'。

字符[^xyz] 
意义:一字符补集,也就是说,它匹配除了列出的字符外的所有东西。 你可以使用连字符-指出一 
字符范围。 
例如:[^abc]和[^a-c]等价,它们最早匹配"brisket"中的'r'和"chop."中的'h'。

字符[\b] 
意义:匹配一个空格(不要与\b混淆)

字符\b 
意义:匹配一个单词的分界线,比如一个空格(不要与[\b]混淆) 
例如:/\bn\w/匹配"noonday"中的'no',/\wy\b/匹配"possibly yesterday."中的'ly'。

字符\B 
意义:匹配一个单词的非分界线 
例如:/\w\Bn/匹配"noonday"中的'on',/y\B\w/匹配"possibly yesterday."中的'ye'。

字符\cX 
意义:这里的X是一个控制字符。匹配一个字符串的控制字符。 
例如:/\cM/匹配一个字符串中的control-M。

字符\d 
意义:匹配一个数字,等价于[0-9]。 
例如:/\d/或/[0-9]/匹配"B2 is the suite number."中的'2'。

字符\D 
意义:匹配任何的非数字,等价于[^0-9]。 
例如:/\D/或/[^0-9]/匹配"B2 is the suite number."中的'B'。

字符\f 
意义:匹配一个表单符

字符\n 
意义:匹配一个换行符

字符\r 
意义:匹配一个回车符

字符\s 
意义:匹配一个单个white空格符,包括空格,tab,form feed,换行符,等价于[ \f\n\r\t\v]。 
例如:/\s\w*/匹配"foo bar."中的' bar'。

字符\S 
意义:匹配除white空格符以外的一个单个的字符,等价于[^ \f\n\r\t\v]。 
例如:/\S/\w*匹配"foo bar."中的'foo'。

字符\t 
意义:匹配一个制表符

字符\v 
意义:匹配一个顶头制表符

字符\w 
意义:匹配所有的数字和字母以及下划线,等价于[A-Za-z0-9_]。 
例如:/\w/匹配"apple,"中的'a',"$5.28,"中的'5'和"3D."中的'3'。

字符\W 
意义:匹配除数字、字母外及下划线外的其它字符,等价于[^A-Za-z0-9_]。 
例如:/\W/或者/[^$A-Za-z0-9_]/匹配"50%."中的'%'。

字符\n 
意义:这里的n是一个正整数。匹配一个正则表达式的最后一个子串的n的值(计数左圆括号)。

例如:/apple(,)\sorange\1/匹配"apple, orange, cherry, peach."中的'apple, orange',下面 
有一个更加完整的例子。 
注意:如果左圆括号中的数字比\n指定的数字还小,则\n取下一行的八进制escape作为描述。

字符\ooctal和\xhex 
意义:这里的\ooctal是一个八进制的escape值,而\xhex是一个十六进制的escape值,允许在一个 
正则表达式中嵌入ASCII码。


当表达式被检查的时候,文字符号提供了编辑正则表达式的方法。利用文字符号可以使到正则表达 
式保持为常数。例如,如果你在一个循环中使用文字符号来构造一个正则表达式,正则表达式不需进行 
反复编译。 
正则表达式对象构造器,例如,new RegExp("ab+c"),提供正则表达式的运行时编译。当你知道正 
则表达式的模式会变化的时候,应该使用构造函数,或者你不知道正则表达式的模式,而它们是从另外 
的源获得的时候,比如由用户输入时。一旦你定义好了正则表达式,该正则表达式可在任何地方使用, 
并且可以改变,你可以使用编译方法来编译一个新的正则表达式以便重新使用。 
一个分离预先定义的RegExp对象可以在每个窗口中使用;也就是说,每个分离的JavaScript线程运 
行以获得自己的RegExp对象。因为每个脚本在一个线程中是不可中断的,这就确保了不同的脚本不会覆 
盖RegExp对象的值。 
预定义的RegExp对象包含的静态属性:input, multiline, lastMatch,lastParen, leftContext, 
rightContext, 以及从$1到$9。input和multiline属性能被预设。其它静态属性的值是在执行个别正则 
表达式对象的exec和test方法后,且在执行字符串的match和replace方法后设置的。

属性 
注意RegExp对象的几个属性既有长名字又有短名字(象Perl)。这些名字都是指向相同的值。Perl是 
一种编程语言,而JavaScript模仿了它的正则表达式。

属性$1, ..., $9 
取得匹配的子串,如果有的话

属性$_ 
参考input

属性$* 
参考multiline

属性$& 
参考lastMatch

属性$+ 
参考lastParen

属性$` 
参考leftContext

属性$' 
参考rightContext

属性constructor 
指定用来建立对象原型函

属性global 
决定是否测试正则表达式是否不能匹配所有的字符串,或者只是与最先的冲突。

属性ignoreCase 
决定试图匹配字符串的时候是否忽略大小写

属性input 
当正则表达式被匹配的时候,为相反的字符串。

属性lastIndex 
决定下一次匹配从那里开始

属性lastMatch 
最后一个匹配的字符

属性lastParen 
子串匹配的时候,最后一个parenthesized,如果有的话。

属性leftContext 
最近一次匹配前的子串。

属性multiline 
是否在串的多行中搜索。

属性prototype 
允许附加属性到所有的对象

属性rightContext 
最近一次匹配后的的子串。

属性source 
模式文本

 


方法 
compile方法 
编译一个正则表达式对象

exec方法 
运行正则表达式匹配

test方法 
测试正则达式匹配

toSource方法 
返回一个对象的文字描述指定的对象;你可以使用这个值来建立一个新的对象。不考虑Object.toS 
ource方法。

toString方法 
返回一个字符串描述指定的对象,不考虑Object.toString对象。

valueOf方法 
返回指定对角的原始值。不考虑Object.valueOf方法。

 另外,这个对象继承了对象的watch和unwatch方法


   例子: 
   例1、下述示例脚本使用replace方法来转换串中的单词。在替换的文本中,脚本使用全局 RegExp 
对象的$1和$2属性的值。注意,在作为第二个参数传递给replace方法的时候,RegExp对象的$属性的名 
称。 
<SCRIPT LANGUAGE="JavaScript1.2"> 
re = /(\w+)\s(\w+)/; 
str = "John Smith"; 
newstr=str.replace(re,"$2, $1"); 
document.write(newstr) 
</SCRIPT> 
显示结果:"Smith, John".

  例2、下述示例脚本中,RegExp.input由Change事件处理句柄设置。在getInfo函数中,exec 方法 
使用RegExp.input的值作为它的参数,注意RegExp预置了$属性。


<SCRIPT LANGUAGE="JavaScript1.2"> 
function getInfo(abc) 

re = /(\w+)\s(\d+)/; 
re.exec(abc.value); 
window.alert(RegExp.$1 + ", your age is " + RegExp.$2); 

</SCRIPT>

  请输入你的姓和年龄,输入完后按回车键。 
   <FORM><INPUT TYPE="TEXT" NAME="NameAge" onChange="getInfo(this);"></FORM> 
   </HTML>


$1, ..., $9属性 
用圆括号括着的匹配子串,如果有的话。 
是RegExp的属性 
静态,只读

在JavaScript 1.2, NES 3.0以上版本提供 
描述:因为input是静态属性,不是个别正则表达式对象的属性。你可以使用RegExp.input 访问该 
属性。

能加上圆括号的子串的数量不受限制,但正则表达式对象只能保留最后9 条。如果你要访问所有的 
圆括号内的匹配字串,你可以使用返回的数组。

这些属性能用在RegExp.replace方法替换后的字符串(输出结果)。当使用这种方式的时候,不用预 
先考虑RegExp对象。下面给出例子。当正则表达式中没有包含圆括号的时候,该脚本解释成$n的字面意 
义。(这里的n是一个正整数)。


例如: 
下例脚本使用replace 方法来交换串中单词的位置。在替换后的文本字串中,脚本使用正则表达式 
RegExp对象的$1和$2属性的值。注意:当它们向replace方法传递参数的时候,这里没有考虑 $ 属性的 
RegExp对象的名称。 
<SCRIPT LANGUAGE="JavaScript1.2"> 
re = /(\w+)\s(\w+)/; 
str = "John Smith"; 
newstr=str.replace(re,"$2, $1"); 
document.write(newstr) 
</SCRIPT> 
显示的输出结果为:Smith, John。

分享到:
评论

相关推荐

    正则表达式regular expression详述

    正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配、查找、替换符合特定模式的字符串。在JavaScript中,正则表达式是通过RegExp对象实现的,自JavaScript 1.2版本开始引入。RegExp对象提供了多种...

    正则表达式regular expression详述 最全

    正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配、查找、替换等操作。在JavaScript中,正则表达式由RegExp对象提供支持,自JavaScript 1.2版本起开始引入。它允许程序员创建复杂且灵活的模式来...

    《正则表达式中文手册》

    正则表达式(Regular Expression)是由一系列字符和特殊符号组成的模式串,主要用于规定待匹配字符串的结构。正则表达式可以用来检查一个字符串是否符合某种形式的规范(如邮箱格式、网址格式等),或者用来提取字符...

    正则表达式regular expression详述(二)

    正则表达式(Regular Expression,简称regex)是用于匹配字符串中模式的一种模式语言。在JavaScript中,正则表达式主要用于字符串处理,如搜索、替换、分割等操作。本篇文章主要探讨的是正则表达式在JavaScript中的...

    JAVA正则表达式实例教程

    - **定义:** 正则表达式(Regular Expression)是一种用于匹配字符串中字符组合的工具,广泛应用于搜索、替换等操作中。在 Java 中,正则表达式主要通过 `java.util.regex` 包提供的类来实现。 **1.2 正则表达式的...

    JAVA正则表达式实例教程.pdf

    - 正则表达式(Regular Expression)是一种模式匹配语言,用于文本搜索和替换。它提供了一种简洁而灵活的方式来识别和处理文本中的特定模式或规则。 **1.2 正则表达式的优点** - **减少代码量**:通过简单的模式...

    正则表达式

    一个字符类和它所包含的任何一个字符都匹配,所以正则表达式 / [abc] / 和字母 "a" , "b" , "c" 中的任何一个 都匹配.另外还可以定义否定字符类,这些类匹配的是除那些包含在中括号之内的字符外的所有字符.定义否定...

    正则表达式资料和一些它的应用

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,它在编程语言如JavaScript、Java等中有着广泛的应用。正则表达式通过一套特定的语法来定义字符串的匹配规则,可以用来查找、替换、提取...

    C#字符串和正则表达式参考手册

    正则表达式(Regular Expression)是模式匹配的强大工具,广泛应用于数据验证、文本搜索和替换等场景。C#通过System.Text.RegularExpressions命名空间下的Regex类支持正则表达式。使用正则表达式,你可以定义复杂...

    正则表达式详述第一部

    正则表达式是regular expression,看来英文比中文要好理解多了,就是检查表达式符不符合规定!!正则表达式有一个功能十分强大而又十分复杂的对象RegExp,在Javascript1.2 版本以上提供。 下面我们看看有关正则...

    正则表达式详述 四

    在JavaScript中,正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配字符串中的模式。本文主要讨论正则表达式的一些关键知识点,包括非正则表达式对象的属性引用、`compile`方法以及`exec`方法。 ...

    正则式与样式对比概论RegularExpression.pdf

    正则表达式(Regular Expression,简称RegEx或regex)是一种强大的文本模式匹配工具,用于在字符串中进行搜索、替换、分割等操作。它通过特定的字符组合来定义搜索模式,被广泛应用于各种编程语言、数据库查询、文本...

Global site tag (gtag.js) - Google Analytics