`
黑男爵
  • 浏览: 8166 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

JS中的正则表达式

    博客分类:
  • Ajax
阅读更多

正则表达式可以:
•测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证
•替换文本。可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字
•根据模式匹配从字符串中提取一个子字符串。可以用来在文本或输入字段中查找特定文字

正则表达式语法
一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

创建正则表达式

	var re = new RegExp();//RegExp是一个对象,和Aarray一样
	//但这样没有任何效果,需要将正则表达式的内容作为字符串传递进去
	re =new RegExp("a");//最简单的正则表达式,将匹配字母a
	re=new RegExp("a","i");//第二个参数,表示匹配时不分大小写



RegExp构造函数第一个参数为正则表达式的文本内容,而第一个参数则为可选项标志.标志可以组合使用

•g (全文查找)
•i (忽略大小写)
•m (多行查找)

   
var re = new RegExp("a","gi");//匹配所有的a或A


正则表达式还有另一种正则表达式字面量的声明方式

var re = /a/gi;



和正则表达式相关的方法和属性


正则表达式对象的方法

•test,返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在则返回 true,否则就返回 false。
•exec,用正则表达式模式在字符串中运行查找,并返回包<script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.iteye.com/javascripts/tinymce/plugins/javaeye/langs /zh.js"></script>含该查找结果的一个数组。
•compile,把正则表达式编译为内部格式,从而执行得更快。
正则表达式对象的属性

•source,返回正则表达式模式的文本的复本。只读。
•lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的开始位置。
•$1...$9,返回九个在模式匹配期间找到的、最近保存的部分。只读。
•input ($_),返回执行规范表述查找的字符串。只读。
•lastMatch ($&),返回任何正则表达式搜索过程中的最后匹配的字符。只读。
•lastParen ($+),如果有的话,返回任何正则表达式查找过程中最后括的子匹配。只读。
•leftContext ($`),返回被查找的字符串中从字符串开始位置到最后匹配之前的位置之间的字符。只读。
•rightContext ($'),返回被搜索的字符串中从最后一个匹配位置开始到字符串结尾之间的字符。只读。
String对象一些和正则表达式相关的方法

•match,找到一个或多个正则表达式的匹配。
•replace,替换与正则表达式匹配的子串。
•search,检索与正则表达式相匹配的值。
•split,把字符串分割为字符串数组。


测试正则表达式是如何工作的!

  
	//test方法,测试字符串,符合模式时返回true,否则返回false
	var re = /he/;//最简单的正则表达式,将匹配he这个单词
	var str = "he";
	alert(re.test(str));//true
	str = "we";
	alert(re.test(str));//false
	str = "HE";
	alert(re.test(str));//false,大写,如果要大小写都匹配可以指定i标志(i是ignoreCase或case-insensitive的表示)
	re = /he/i;
	alert(re.test(str));//true
	str = "Certainly!He loves her!";
	alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符,则可使用^和$
	re = /^he/i;//脱字符(^)代表字符开始位置
	alert(re.test(str));//false,因为he不在str最开始
	str = "He is a good boy!";
	alert(re.test(str));//true,He是字符开始位置,还需要使用$
	re = /^he$/i;//$表示字符结束位置
	alert(re.test(str));//false
	str = "He";
	alert(re.test(str));//true
	//当然,这样不能发现正则表达式有多强大,因为我们完全可以在上面的例子中使用==或indexOf
	re = /\s/;// \s匹配任何空白字符,包括空格、制表符、换页符等等
	str= "user Name";//用户名包含空格
	alert(re.test(str));//true
	str = "user		Name";//用户名包含制表符
	alert(re.test(str));//true
	re=/^[a-z]/i;//[]匹配指定范围内的任意字符,这里将匹配英文字母,不区分大小写
	str="variableName";//变量名必须以字母开头
	alert(re.test(str));//true
	str="123abc";
	alert(re.test(str));//false



当然,仅仅知道了字符串是否匹配模式还不够,我们还需要知道哪些字符匹配了模式

   
	var osVersion = "Ubuntu 8";//其中的8表示系统主版本号
	var re = /^[a-z]+\s+\d+$/i; //+号表示字符至少要出现1次,\s表示空白字符,\d表示一个数字
	alert(re.test(osVersion));//true,但我们想知道主版本号
	//另一个方法exec,返回一个数组,数组的第一个元素为完整的匹配内容
	re=/^[a-z]+\s+\d+$/i;
	arr = re.exec(osVersion);
	alert(arr[0]);//将osVersion完整输出,因为整个字符串刚好匹配re
	//我只需要取出数字
	re=/\d+/;
	var arr = re.exec(osVersion);
	alert(arr[0]);//8



更复杂的用法,使用子匹配

  
	//exec返回的数组第1到n元素中包含的是匹配中出现的任意一个子匹配
	re=/^[a-z]+\s+(\d+)$/i;//用()来创建子匹配
	arr =re.exec(osVersion);
	alert(arr[0]);//整个osVersion,也就是正则表达式的完整匹配
	alert(arr[1]);//8,第一个子匹配,事实也可以这样取出主版本号
	alert(arr.length);//2
	osVersion = "Ubuntu 8.10";//取出主版本号和次版本号
	re = /^[a-z]+\s+(\d+)\.(\d+)$/i;//.是正则表达式元字符之一,若要用它的字面意义须转义
	arr = re.exec(osVersion);
	alert(arr[0]);//完整的osVersion
	alert(arr[1]);//8
	alert(arr[2]);//10



注意,当字符串不匹配re时,exec方法将返回null 

String对象的一些和正则表达式有关的方法

 
	//replace方法,用于替换字符串
	var str ="some money";
	alert(str.replace("some","much"));//much money
	//replace的第一个参数可以为正则表达式
	var re = /\s/;//空白字符
	alert(str.replace(re,"%"));//some%money
	//在不知道字符串中有多少空白字符时,正则表达式极为方便
	str ="some some 			\tsome\t\f";
	re = /\s+/;
	alert(str.replace(re,"#"));//但这样只会将第一次出现的一堆空白字符替换掉
	//因为一个正则表达式只能进行一次匹配,\s+匹配了第一个空格后就退出了
	re = /\s+/g;//g,全局标志,将使正则表达式匹配整个字符串
	alert(str.replace(re,"@"));//some@some@some@
	//另一个与之相似的是split
	var str = "a-bd-c";
	var arr = str.split("-");//返回["a","bd","c"]
	//如果str是用户输入的,他可能输入a-bd-c也可能输入a bd c或a_bd_c,但不会是abdc(这样就说他输错了)
	str = "a_db-c";//用户以他喜欢的方式加分隔符s
	re=/[^a-z]/i;//前面我们说^表示字符开始,但在[]里它表示一个负字符集
	//匹配任何不在指定范围内的任意字符,这里将匹配除字母处的所有字符
	arr = str.split(re);//仍返回["a","bd","c"];
	//在字符串中查找时我们常用indexOf,与之对应用于正则查找的方法是search
	str = "My age is 18.Golden age!";//年龄不是一定的,我们用indexOf不能查找它的位置
	re = /\d+/;
	alert(str.search(re));//返回查找到的字符串开始下标10
	//注意,因为查找本身就是出现第一次就立即返回,所以无需在search时使用g标志
	//下面的代码虽然不出错,但g标志是多余的
	re=/\d+/g;
	alert(str.search(re));//仍然是10


注意,当search方法没有找到匹配时,将返回-1

类似于exec方法,String对象的match方法也用于将字符串与正则表达式进行匹配并返回结果数组

 
	var str = "My name is CJ.Hello everyone!";
	var re = /[A-Z]/;//匹配所有大写字母
	var arr = str.match(re);//返回数组
	alert(arr);//数组中只会包含一个M,因为我们没有使用全局匹配
	re = /[A-Z]/g;
	arr = str.match(re);
	alert(arr);//M,C,J,H
	//从字符串中抽取单词
	re = /\b[a-z]\b/i;//\b表示单词边界
	str = "one two three four";
	alert(str.match(re));//one,two,three,four



RegExp对象实例的一些属性

  
	var re = /[a-z]/i;
	alert(re.source);//将[a-z]字符串输出
	//请注意,直接alert(re)会将正则表达式连同前向斜线与标志输出,这是re.toString方法定义的



每个RegExp对象的实例具有lastIndex属性,它是被查找字符串中下一次成功匹配的开始位置,默认值是-1。 lastIndex 属性被 RegExp 对象的 exec 和 test 方法修改.并且它是可写的.

  
	var re = /[A-Z]/;
	//exec方法执行后,修改了re的lastIndex属性,
	var str = "Hello,World!!!";
	var arr = re.exec(str);
	alert(re.lastIndex);//0,因为没有设置全局标志
	re = /[A-Z]/g;
	arr = re.exec(str);
	alert(re.lastIndex);//1
	arr = re.exec(str);
	alert(re.lastIndex);//7



当匹配失败(后面没有匹配),或lastIndex值大于字符串长度时,再执行exec等方法会将lastIndex设为0(开始位置)

 
	var re = /[A-Z]/;
	var str = "Hello,World!!!";
	re.lastIndex = 120;
	var arr = re.exec(str);
	alert(re.lastIndex);//0



RegExp对象的静态属性

  
	//input 最后用于匹配的字符串(传递给test,exec方法的字符串)
	var re = /[A-Z]/;
	var str = "Hello,World!!!";
	var arr = re.exec(str);
	alert(RegExp.input);//Hello,World!!!
	re.exec("tempstr");
	alert(RegExp.input);//仍然是Hello,World!!!,因为tempstr不匹配
	//lastMatch 最后匹配的字符
	re = /[a-z]/g;
	str = "hi";
	re.test(str);
	alert(RegExp.lastMatch);//h
	re.test(str);
	alert(RegExp["$&"]);//i  ,$&是lastMatch的短名字,但由于它不是合法变量名,所以要。。
	//lastParen 最后匹配的分组
	re = /[a-z](\d+)/gi;
	str = "Class1 Class2 Class3";
	re.test(str);
	alert(RegExp.lastParen);//1
	re.test(str);
	alert(RegExp["$+"]);//2
	//leftContext  返回被查找的字符串中从字符串开始位置到最后匹配之前的位置之间的字符
	//rigthContext 返回被搜索的字符串中从最后一个匹配位置开始到字符串结尾之间的字符
	re = /[A-Z]/g;
	str = "123ABC456";
	re.test(str);
	alert(RegExp.leftContext);//123
	alert(RegExp.rightContext);//BC456
	re.test(str);
	alert(RegExp["$`"]);//123A
	alert(RegExp["$'"]);//C456



multiline属性返回正则表达式是否使用多行模式,这个属性不针对某个正则表达式实例,而是针对所有正则表达式,并且这个属性可写.(IE与Opera不支持这个属性)

 
	alert(RegExp.multiline);
	//因为IE,Opera不支持这个属性,所以最好还是单独指定
	var re = /\w+/m;
	alert(re.multiline);
	alert(RegExp["$*"]);//RegExp对象的静态属性不会因为给RegExp某个对象实例指定了m标志而改变
	RegExp.multiline = true;//这将打开所有正则表达式实例的多行匹配模式
	alert(RegExp.multiline);



使用元字符注意事项:元字符是正则表达式的一部分,当我们要匹配正则表达式本身时,必须对这些元字符转义.下面是正则表达式用到的所有元字符
( [ { \ ^ $ | ) ? * + .

  
var str = "?";
	var re = /?/;
	alert(re.test(str));//出错,因为?是元字符,必须转义
	re = /\?/;
	alert(re.test(str));//true



使用RegExp构造函数与使用正则表达式字面量创建正则表达式注意点

 
	var str = "\?";
	alert(str);//只会输出?
	var re = /\?/;//将匹配?
	alert(re.test(str));//true
	re = new RegExp("\?");//出错,因为这相当于re = /\?/
	re = new RegExp("\\?");//正确,将匹配?
	alert(re.test(str));//true



既然双重转义这么不友好,所以还是用正则表达式字面量的声明方式

如何在正则表达式中使用特殊字符?

 
	//ASCII方式用十六进制数来表示特殊字符
	var re = /^\x43\x4A$/;//将匹配CJ
	alert(re.test("CJ"));//true
	//也可使用八进制方式
	re = /^\103\112$/;//将匹配CJ
	alert(re.test("CJ"));//true
	//还可以使用Unicode编码
	re =/^\u0043\u004A$/;//使用 Unicode,必须使用u开头,接着是字符编码的四位16进制表现形式
	alert(re.test("CJ"));



另处,还有一些其它的预定义特殊字符,如下表所示:

字符    描述
\n      换行符
\r      回车符
\t      制表符
\f      换页符(Tab)
\cX     与X对应的控制字符
\b      退格符(BackSpace)
\v      垂直制表符
\0      空字符("")

字符类 ---〉简单类,反向类,范围类,组合类,预定义类

 
	//简单类
	var re = /[abc123]/;//将匹配abc123这6个字符中一个
	//负向类
	re = /[^abc]/;//将匹配除abc之外的一个字符
	//范围类
	re = /[a-b]/;//将匹配小写a-b 26个字母
	re = /[^0-9]/;//将匹配除0-9 10个字符之处的一个字符
	//组合类
	re = /[a-b0-9A-Z_]/;//将匹配字母,数字和下划线



下面是正则表达式中的预定义类


代码  等同于                  匹配
.     IE下[^\n],其它[^\n\r]  匹配除换行符之外的任何一个字符
\d    [0-9]                   匹配数字
\D    [^0-9]                  匹配非数字字符
\s    [ \n\r\t\f\x0B]         匹配一个空白字符
\S    [^ \n\r\t\f\x0B]        匹配一个非空白字符
\w    [a-zA-Z0-9_]            匹配字母数字和下划线
\W    [^a-zA-Z0-9_]           匹配除字母数字下划线之外的字符


分享到:
评论

相关推荐

    Java使用正则表达式提取XML节点内容的方法示例

    1. JavaScript正则表达式在线测试工具:http://tools.jb51.net/regex/javascript 2. 正则表达式在线生成工具:http://tools.jb51.net/regex/create_reg 这些工具可以帮助开发者快速测试和生成正则表达式,从而提高...

    javascript正则表达式迷你书 (1).pdf

    正则表达式中的字符匹配攻略是指使用特殊的字符或符号来匹配字符串中的特定模式。例如,`.`字符可以匹配任何单个字符,而`[abc]`字符组可以匹配任何一个在方括号中的字符。 横向模糊匹配 横向模糊匹配是指使用特殊...

    正则表达式必知必会v_1.0.pdf

    在正则表达式中,元字符表示在正则表达式中不代表其字面含义,而是具有特别意义的字符。例如句点(.)、中括号字符([])、反斜线(\)等都是元字符。为了使用元字符的字面意思,需要进行转义,例如使用反斜线(\)...

    js_正则表达式全攻略

    ### 正则表达式在JavaScript中的应用全攻略 #### 一、正则表达式的概念及其在JavaScript中的重要性 正则表达式(Regular Expression)是一种强大的文本处理工具,能够帮助开发者进行复杂的字符串搜索和替换。在...

    jq非空验证,js正则表达式验证邮箱和手机号码

    JavaScript正则表达式是用于匹配字符串模式的强大工具。在验证邮箱和手机号码时,我们需要创建符合特定规则的正则表达式。对于邮箱验证,通常的正则表达式如下: ```javascript var emailRegex = /^[a-zA-Z0-9._%...

    js正则表达式限制文本框只能输入数字,能输小数点.

    由于`.`在正则表达式中有特殊意义,因此需要用反斜杠`\`进行转义。 - `\d*` 再次匹配零个或多个数字。 - `$` 表示字符串的结束。 整个正则表达式的意思是:匹配一个可能包含小数点的数字序列,但小数点最多只出现一...

    精通正则表达式(第三版)简体中文版

    1. **元字符**:正则表达式中的特殊字符,用于指定模式。例如,“.”可以匹配任何单个字符(除了换行符),而“*”表示匹配前面的字符零次或多次。 2. **量词**:用来指定模式出现的次数。例如,“a{3}”表示匹配...

    常用正则表达式大全.txt

    根据提供的文件信息,我们可以整理出一系列与正则表达式相关的...以上内容概括了从文件中提取出来的正则表达式知识点,这些知识点覆盖了正则表达式的多个应用场景,对于从事软件开发、数据分析等领域的人来说非常实用。

    js正则表达式(姓名、证件号码)

    js正则表达式,按甲方(银行)提供的个人证件信息采集规则编写的对应正则表达式

    三目运算符+正则表达式

    在编程世界中,三目运算符和正则表达式是两个非常重要的概念,它们各自扮演着独特的角色,同时也常被结合起来使用,以提高代码的简洁性和效率。让我们深入探讨这两个主题。 首先,三目运算符,也称为条件运算符,是...

    javascript常用正则表达式大全

    javascript常用正则表达式大全,基本覆盖基本需求的正则表达式

    JS只能输入数字,数字和字母等的正则表达式

    在JavaScript(JS)中,正则表达式是一种强大的工具,用于匹配、查找、替换和验证字符串中的模式。本文将深入探讨如何使用正则表达式来限制用户在HTML文本框中只能输入数字和字母。 首先,我们需要理解正则表达式的...

    JavaScript正则表达式迷你书

    《JavaScript正则表达式迷你书》是一本关于JavaScript正则表达式的专业书籍,正则表达式是处理字符串的强大工具,广泛应用于编程语言中的文本处理。本书从字符匹配、位置匹配、括号的作用、回溯法原理、拆分、构建和...

    正则表达式调试工具

    正则表达式(Regular Expression,简称regex)是用于在文本中匹配特定模式的强大工具,广泛应用于数据验证、搜索替换和文本处理等领域。正则表达式调试工具是开发人员用来测试和优化这些模式的重要辅助工具。本文将...

    使用正则表达式验证一年的12个月份

    正则表达式是一种强大的文本处理工具,用于匹配、查找、替换等操作,广泛应用于编程语言中。在IT行业中,正则表达式是处理字符串时不可或缺的一部分,尤其在数据验证、文本提取等方面。在这个场景中,我们需要创建一...

    通过正则表达式生成数据

    2. **利用编程语言**:大多数编程语言如Python、Java、JavaScript等都内置了正则表达式的支持,并提供了方法来生成符合正则表达式的随机字符串。例如,Python的`re`模块配合`random.choice`或`random.choices`可以...

    JS的正则表达式进行验证

    在JavaScript(JS)中,正则表达式同样发挥着不可或缺的作用,尤其是在用户输入验证方面,能够极大地提高程序的健壮性和用户体验。 ### 标题解析:“JS的正则表达式进行验证” 标题直接点明了文章的主题,即利用...

    jS 正则表达式实现关键字高亮显示

    在JavaScript(JS)中,正则表达式是一种强大的文本处理工具,可以用于匹配、查找、替换等操作。在本文中,我们将深入探讨如何利用正则表达式实现关键字的高亮显示,尤其适用于文本搜索和代码高亮场景。下面将详细...

Global site tag (gtag.js) - Google Analytics