`
chaoyi
  • 浏览: 309618 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

第十章:正则表达式

阅读更多

学习要点:
1.什么是正则表达式
2.创建正则表达式
3.获取控制
4.常用的正则

假设用户需要在 HTML 表单中填写姓名、地址、出生日期等。那么在将表单提交到服务器进一步处理前,JavaScript 程序会检查表单以确认用户确实输入了信息并且这些信息是符合要求的。

一.什么是正则表达式
正则表达式(regular expression)是一个描述字符模式的对象。ECMAScript 的 RegExp 类表示正则表达式, 而 String 和 RegExp 都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。
正则表达式主要用来验证客户端的输入数据。 用户填写完表单单击按钮之后, 表单就会被发送到服务器,在服务器端通常会用 PHP、 ASP.NET 等服务器脚本对其进行进一步处理。
因为客户端验证,可以节约大量的服务器端的系统资源,并且提供更好的用户体验。

 

二.创建正则表达式
创建正则表达式和创建字符串类似, 创建正则表达式提供了两种方法, 一种是采用 new 运算符,另一个是采用字面量方式。
1.两种创建方式

var box = new RegExp('box'); //第一个参数字符串
var box = new RegExp('box', 'ig'); //第二个参数可选模式修饰符

 

模式修饰符的可选参数



 

var box = /box/; //直接用两个反斜杠
var box = /box/ig; //在第二个斜杠后面加上模式修饰符

 
2.测试正则表达式
RegExp 对象包含两个方法: test()和 exec(), 功能基本相似, 用于测试字符串匹配。 test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值, 如果存在则返回 true, 不存在则返回 false。exec()方法也用于在字符串中查找指定正则表达式,如果 exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回 null。

RegExp 对象的方法

 

 

/*使用 new 运算符的 test 方法示例*/

var pattern = new RegExp('box', 'i'); //创建正则模式,不区分大小写
var str = 'This is a Box!'; //创建要比对的字符串
alert(pattern.test(str)); //通过 test()方法验证是否匹配

 
/*使用字面量方式的 test 方法示例*/

var pattern = /box/i; //创建正则模式,不区分大小写
var str = 'This is a Box!';
alert(pattern.test(str));

 
/*使用一条语句实现正则匹配*/

alert(/box/i.test('This is a Box!')); //模式和字符串替换掉了两个变量

 
/*使用 exec 返回匹配数组*/

var pattern = /box/i;
var str = 'This is a Box!';
alert(pattern.exec(str)); //匹配了返回数组,否则返回 null

 
PS:exec 方法还有其他具体应用,我们在获取控制学完后再看。
3.使用字符串的正则表达式方法
除了 test()和 exec()方法,String 对象也提供了 4 个使用正则表达式的方法。


String 对象中的正则表达式方法



 

/*使用 match 方法获取获取匹配数组*/

var pattern = /box/ig; //全局搜索
var str = 'This is a Box!,That is a Box too';
alert(str.match(pattern)); //匹配到两个 Box,Box
alert(str.match(pattern).length); //获取数组的长度

 
/*使用 search 来查找匹配数据*/

var pattern = /box/ig;
var str = 'This is a Box!,That is a Box too';
alert(str.search(pattern)); //查找到返回位置,否则返回-1

 
PS:因为 search 方法查找到即返回,也就是说无需 g 全局
/*使用 replace 替换匹配到的数据*/

var pattern = /box/ig;
var str = 'This is a Box!,That is a Box too';

 
alert(str.replace(pattern, 'Tom')); //将 Box 替换成了 Tom
/*使用 split 拆分成字符串数组*/

var pattern = / /ig;
var str = 'This is a Box!,That is a Box too';
alert(str.split(pattern)); //将空格拆开分组成数组

 
RegExp 对象的静态属性



 

/*使用静态属性*/

var pattern = /(g)oogle/;
var str = 'This is google!';
pattern.test(str); //执行一下
alert(RegExp.input); //This is google!
alert(RegExp.leftContext); //This is
alert(RegExp.rightContext); //!
alert(RegExp.lastMatch); //google
alert(RegExp.lastParen); //g
alert(RegExp.multiline); //false

 
PS:Opera 不支持 input、lastMatch、lastParen 和 multiline 属性。IE 不支持 multiline 属性。
所有的属性可以使用短名来操作
RegExp.input 可以改写成 RegExp['$_'],依次类推。但 RegExp.input 比较特殊,它还可以写成 RegExp.$_。


RegExp 对象的实例属性



 

/*使用实例属性*/

var pattern = /google/ig;
alert(pattern.global); //true,是否全局了
alert(pattern.ignoreCase); //true,是否忽略大小写
alert(pattern.multiline); //false,是否支持换行
alert(pattern.lastIndex); //0,下次的匹配位置
alert(pattern.source); //google,正则表达式的源字符串
var pattern = /google/g;
var str = 'google google google';
pattern.test(str); //google,匹配第一次
alert(pattern.lastIndex); //6,第二次匹配的位

 
PS: 以上基本没什么用。 并且 lastIndex 在获取下次匹配位置上 IE 和其他浏览器有偏差,主要表现在非全局匹配上。lastIndex 还支持手动设置,直接赋值操作。

 

三.获取控制
正则表达式元字符是包含特殊含义的字符。 它们有一些特殊功能, 可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。


字符类:单个字符和数字



 

字符类:空白字符



 

字符类:锚字符



 

字符类:重复字符



 

字符类:替代字符



 

字符类:记录字符



 

 

/*使用点元字符*/

var pattern = /g..gle/; //.匹配一个任意字符
var str = 'google';
alert(pattern.test(str));

 
/*重复匹配*/

var pattern = /g.*gle/; //.匹配 0 个一个或多个
var str = 'google'; //*,?,+,{n,m}
alert(pattern.test(str));

 
/*使用字符类匹配*/

var pattern = /g[a-zA-Z_]*gle/; //[a-z]*表示任意个 a-z 中的字符
var str = 'google';
alert(pattern.test(str));
var pattern = /g[^0-9]*gle/; //[^0-9]*表示任意个非 0-9 的字符
var str = 'google';
alert(pattern.test(str));
var pattern = /[a-z][A-Z]+/; //[A-Z]+表示 A-Z 一次或多次
var str = 'gOOGLE';
alert(pattern.test(str));

 
/*使用元符号匹配*/

var pattern = /g\w*gle/; //\w*匹配任意多个所有字母数字_
var str = 'google';
alert(pattern.test(str));
var pattern = /google\d*/; //\d*匹配任意多个数字
var str = 'google444';
alert(pattern.test(str));
var pattern = /\D{7,}/; //\D{7,}匹配至少 7 个非数字
var str = 'google8';
alert(pattern.test(str));

 
/*使用锚元字符匹配*/

var pattern = /^google$/; //^从开头匹配,$从结尾开始匹配
var str = 'google';
alert(pattern.test(str));
var pattern = /goo\sgle/; //\s 可以匹配到空格
var str = 'goo gle';
alert(pattern.test(str));
var pattern = /google\b/; //\b 可以匹配是否到了边界
var str = 'google';
alert(pattern.test(str));

 
/*使用或模式匹配*/

var pattern = /google|baidu|bing/; //匹配三种其中一种字符串
var str = 'google';
alert(pattern.test(str));

 
/*使用分组模式匹配*/

var pattern = /(google){4,8}/; //匹配分组里的字符串 4-8 次
var str = 'googlegoogle';
alert(pattern.test(str));
var pattern = /8(.*)8/; //获取 8..8 之间的任意字符
var str = 'This is 8google8';
str.match(pattern);
alert(RegExp.$1); //得到第一个分组里的字符串内容
var pattern = /8(.*)8/;
var str = 'This is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>'); //得到替换的字符串输出
document.write(result);
var pattern = /(.*)\s(.*)/;
var str = 'google baidu';
var result = str.replace(pattern, '$2 $1'); //将两个分组的值替换输出
document.write(result);



  


/*关于贪婪和惰性*/

var pattern = /[a-z]+?/; //?号关闭了贪婪匹配,只替换了第一个
var str = 'abcdefjhijklmnopqrstuvwxyz';
var result = str.replace(pattern, 'xxx');
alert(result);
var pattern = /8(.+?)8/g; //禁止了贪婪,开启的全局
var str = 'This is 8google8, That is 8google8, There is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>');
document.write(result);
var pattern = /8([^8]*)8/g; //另一种禁止贪婪
var str = 'This is 8google8, That is 8google8, There is 8google8';
var result = str.replace(pattern,'<strong>$1</strong>');
document.write(result);

 
/*使用 exec 返回数组*/

var pattern = /^[a-z]+\s[0-9]{4}$/i;
var str = 'google 2012';
alert(pattern.exec(str)); //返回整个字符串
var pattern = /^[a-z]+/i; //只匹配字母
var str = 'google 2012';
alert(pattern.exec(str)); //返回 google
var pattern = /^([a-z]+)\s([0-9]{4})$/i; //使用分组
var str = 'google 2012';
alert(pattern.exec(str)[0]); //google 2012
alert(pattern.exec(str)[1]); //google
alert(pattern.exec(str)[2]); //2012

 
/*捕获性分组和非捕获性分组*/

var pattern = /(\d+)([a-z])/; //捕获性分组
var str = '123abc';
alert(pattern.exec(str));
var pattern = /(\d+)(?:[a-z])/; //非捕获性分组
var str = '123abc';
alert(pattern.exec(str));

 
/*使用分组嵌套*/

var pattern = /(A?(B?(C?)))/; //从外往内获取
var str = 'ABC';
alert(pattern.exec(str));

 
/*使用前瞻捕获*/

var pattern = /(goo(?=gle))/; //goo 后面必须跟着 gle 才能捕获
var str = 'google';
alert(pattern.exec(str));

 
/*使用特殊字符匹配*/

var pattern = /\.\[\/b\]/; //特殊字符,用\符号转义即可
var str = '.[/b]';
alert(pattern.test(str));

 
/*使用换行模式*/

var pattern = /^\d+/mg; //启用了换行模式
var str = '1.baidu\n2.google\n3.bing';
var result = str.replace(pattern, '#');
alert(result);

 

四.常用的正则
1.检查邮政编码

var pattern = /[1-9][0-9]{5}/; //共 6 位数字,第一位不能为 0
var str = '224000';
alert(pattern.test(str));

 
2.检查文件压缩包

var pattern = /[\w]+\.zip|rar|gz/; //\d\w_表示所有数字和字母加下划线
var str = '123.zip'; //\.表示匹配.,后面是一个选择
alert(pattern.test(str));

 
3.删除多余空格

var pattern = /\s/g; //g 必须全局,才能全部匹配
var str = '111 222 333';
var result = str.replace(pattern,''); //把空格匹配成无空格
alert(result);

 
4.删除首尾空格

var pattern = /^\s+/; //强制首
var str = ' goo gle ';
var result = str.replace(pattern, '');
pattern = /\s+$/; //强制尾
result = result.replace(pattern, '');
alert('|' + result + '|');
var pattern = /^\s*(.+?)\s*$/; //使用了非贪婪捕获
var str = ' google ';
alert('|' + pattern.exec(str)[1] + '|' );
var pattern = /^\s*(.+?)\s*$/;
var str = ' google ';
alert('|' + str.replace(pattern, '$1') + '|'); //使用了分组获取

 
5.简单的电子邮件验证

var pattern = /^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/;
var str = 'chaoyi77@163.com';
alert(pattern.test(str));
var pattern = /^([\w\.\-]+)@([\w\.\-]+)\.([\w]{2,4})$/;
var str = 'chaoyi77@163.com';
alert(pattern.test(str));

 

  • 大小: 19.4 KB
  • 大小: 13.6 KB
  • 大小: 16.9 KB
  • 大小: 27.5 KB
  • 大小: 36.5 KB
  • 大小: 30.9 KB
  • 大小: 37.5 KB
  • 大小: 32.5 KB
  • 大小: 23.4 KB
  • 大小: 11.5 KB
  • 大小: 10 KB
  • 大小: 35.8 KB
  • 大小: 15.9 KB
分享到:
评论

相关推荐

    简单入门正则表达式(侧重原理,附属实例)

    第十章 正则表达式综合应用举例: 这一章会提供一些综合性的例子,展示如何将前面章节学到的概念和技巧结合使用,解决实际问题,如电子邮件验证、URL解析等。 第十一章 Java与.NET中的正则表达式应用: 最后,本...

    java各知识点详细总结(毕向东笔记整理)

    第十章:网络编程 284 -309309309 第十一章:反射机制 310 -315315315 第十二章:正则表达式 315 -322322322 第十三章:HTMLHTMLHTMLHTML语言 322 -335 335 335 335 335 335 335 335 335 第十四章:CSS CSS语言 ...

    Java基础详解(入门级)

    第十章:网络编程 284-309 第十一章:反射机制 310-315 第十二章:正则表达式 315-322 第十三章:HTML 语言 322-335 第十四章:CSS 语言 335-341 第十五章:JavaScript 语言 341-375 第十六章:DOM 375-429

    oracle11g

    oracle11g 第一部分:SQL语言基础 第一章:关系型与非关系型数据库 第二章:SQL的基本函数 第三章:SQL的数据类型 第四章、WHERE子句中常用的运算符 第五章:分组函数 ...第二十二章:正则表达式

    python.rar

    "Chapter 10: Regular Expressions"(第十章:正则表达式)深入讨论了正则表达式,这是处理文本模式匹配的强大工具。 最后,书中还包括了一些实用的附录,例如Python标准库的概述,帮助你更好地利用Python的内置...

    《Python语言程序设计2018版》电子教案

    10. **第十章:正则表达式** - 教授使用Python的re模块进行文本匹配和搜索,包括基本的正则表达式语法和高级特性。 11. **第十一章:网络编程与数据库操作** - 简述Python的网络编程基础,如HTTP请求,以及如何使用...

    《python》课程教学大纲.doc.doc

    * 第十章:正则表达式 * 第十一章:多线程及多进程编程 * 第十二章:网络编程 * 第十三章:数据库编程 * 第十四章:NumPy 模块 * 第十五章:pandas 模块 使用教材及主要参考书目: * 选用教材:自编 * 主要参考...

    第十章:项目实战-文档扫描OCR识别,ocr识别pdf,Python

    【标题】:“第十章:项目实战-文档扫描OCR识别,ocr识别pdf,Python” 在这个项目实战中,我们将探讨如何利用OpenCV和Python进行文档扫描及OCR(光学字符识别)识别,特别是针对PDF文件的处理。OCR技术允许我们将...

    JavaScript权威指南

    第十章 使用正则表达式的模式匹配 第十一章 JavaScript的更多主题 第二部分 客户JavaScript 第十二章 Web浏览器中的JavaScript 第十三章 窗口和框架 第十四章 Document对象 第十五章 表单和表单元素 第十六章...

    自己动手写网络爬虫光盘文件10章

    10. **第十章:数据存储与清洗**:讲解如何将爬取的数据存储到文件或数据库中,以及数据清洗的基本方法。 通过这十章的学习,读者能够掌握网络爬虫的全貌,从发送请求到解析数据,再到处理反爬策略,最后将数据存储...

    PHP程序设计思维导图

    原创整理 PHP程序设计的思维... 内容包含: ...第二章:标记、注释 第三章:数据类型 第四章:常量和变量 第五章:运算符 第六章:表达式和函数 第七章:流程控制语句 第八章:字符串操作 第九章:正则表达式 第十章:数组

    python爬虫修改版.pdf

    第三章 正则表达式。 第四章 XPATH 提取数据。 第五章 动态 HTML 处理。 第六章 多线程爬虫实现。 第七章:Scrapy 框架初步。 第八章:增量爬虫。 第九章:验证码识别。 第十章 MongoDB 数据库。 第十一章 爬虫项目...

    UNIX.Shell编程24学时教程

    ### 第十章:案例分析与实战练习 通过实际案例解析,巩固所学知识,并提供一系列实战练习,提升Shell编程能力。 这24学时的教程涵盖了Shell编程的基础到进阶内容,适合初学者逐步深入。通过学习,你可以编写出高效...

    Que.Korn.Shell.Programming.by.Example.Feb.2001

    **第十章:输出控制** 控制脚本的输出是非常重要的,尤其是在开发大型脚本时。本章讨论了如何重定向标准输出和标准错误输出,以及如何使用日志文件记录脚本运行过程中的信息。 #### 诊断 **第十一章:诊断** 最后...

    shell编程从入门到精通

    ### 第十章:进程管理和信号处理 理解如何在脚本中启动、控制和通信子进程,以及使用`kill`发送信号。 ### 第十一章:正则表达式和模式匹配 学习正则表达式的基础知识,以及如何在Shell中使用`grep`、`sed`和`awk`...

    毕向东Java SE视频教程整理笔记

    #### 第十章:网络编程 - **网络编程基础**:Java支持TCP/IP协议栈,提供了Socket类来实现客户端和服务端之间的通信。 #### 第十一章:反射机制 - **反射基础**:反射允许程序在运行时检查类的信息并动态创建对象...

    Linux命令行中文版

    第十章:权限 本章节主要介绍了 Linux 权限的基本概念和操作,包括用户、组和权限的管理等。 第十一章:进程 本章节主要讲述了 Linux 进程的基本概念和管理,包括进程的创建、执行和结束等。 第十二章:shell ...

    javascript

    12. **第十二章:正则表达式** - 正则表达式是字符串匹配和处理的强大工具,本章将讲解正则基本语法和高级用法。 13. **第十三章:定时器与节流防抖** - 学习setTimeout和setInterval的用法,以及如何通过节流和...

Global site tag (gtag.js) - Google Analytics