常用的正则表达式主要有以下几种:
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
匹配国内电话号码:\d-\d|\d-\d
评注:匹配形式如 0511-4405222 或 021-87888822
匹配腾讯QQ号:[1-9][0-9]\{4,\}
评注:腾讯QQ号从10000开始
匹配中国邮政编码:[1-9]\d(?!\d)
评注:中国邮政编码为6位数字
匹配身份证:(^\d{15}|\d{18}$)
评注:中国的身份证为15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
评注:提取ip地址时有用
匹配特定数字:
^[1-9]\d*$ //匹配正整数
^-[1-9]\d*$ //匹配负整数
^-?[1-9]\d*$ //匹配整数
^[1-9]\d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
评注:最基本也是最常用的一些表达式
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
匹配国内电话号码:\d-\d|\d-\d
评注:匹配形式如 0511-4405222 或 021-87888822
匹配腾讯QQ号:[1-9][0-9]\{4,\}
评注:腾讯QQ号从10000开始
匹配中国邮政编码:[1-9]\d(?!\d)
评注:中国邮政编码为6位数字
匹配身份证:(^\d{15}|\d{18}$)
评注:中国的身份证为15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
评注:提取ip地址时有用
匹配特定数字:
^[1-9]\d*$ //匹配正整数
^-[1-9]\d*$ //匹配负整数
^-?[1-9]\d*$ //匹配整数
^[1-9]\d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
评注:最基本也是最常用的一些表达式
发表评论
-
HTML <object> 标签
2010-03-04 22:31 840定义和用法 定义一个嵌入的对象。请使用此元素向您的 XHTML ... -
js代码:字符动画
2010-03-04 22:30 839<!DOCTYPE html PUBLIC " ... -
js代码:浏览器状态栏飞入文字
2010-03-04 22:29 1229<!DOCTYPE html PUBLIC " ... -
CSS+DIV实现的页面优化代码
2010-03-04 22:28 631<!DOCTYPE html PUBLIC " ... -
IE捉迷藏问题及解决方案
2010-03-04 22:28 998<!DOCTYPE html PUBLIC " ... -
js代码:飘落的雪花
2010-03-04 22:27 837<!DOCTYPE html PUBLIC " ... -
js代码:渐变图形
2010-03-04 22:26 805<!DOCTYPE html PUBLIC " ... -
jquery学习资料
2010-03-04 22:23 803今天开始看看jquery类库 这是我接触的第三个类库 之前有e ... -
jquery菜鸟入门
2010-03-04 22:23 786转自:http://hi.baidu.com/%B7%C9%D ... -
设置flash透明使div层能显示在其之上
2010-03-04 22:21 1017给flash加上这句代码<param name=&quo ... -
Ajax原理步骤
2010-03-04 22:21 1077核心:XMLHttpRequest对象 属性 ... -
ruby打包成gem
2010-03-04 22:20 1318gem 打包: gem build xxx.rb gem 安装 ... -
prototype Ajax.Updater
2010-03-04 22:19 734var url = "/edit/find_topi ... -
ruby日期指令
2010-03-04 22:17 989%A 周日期全称 Saturday %a 周日期缩写 %B ...
相关推荐
为了简单有效而又不失强大,造成了正则表达式代码的难度较大,学习起来也不是很容易,所以需要付出一些努力才行,入门之后参照一定的参考,使用起来还是比较简单有效的。 例子: ^.+@.+\\..+$ 这样的代码曾经多...
正则表达式是一种强大的文本处理工具,用于查找、替换或提取符合特定模式的文本。它在编程、数据处理和文本分析等领域广泛应用。本教程适合初学者,旨在从基础到高级全面介绍正则表达式。 首先,我们要明确正则...
深入浅出的讲解正则表达式 适合菜鸟入门^_^
本文旨在通过简明扼要的方式介绍正则表达式的核心概念与常见用法,帮助读者在一小时内快速入门。 #### 二、正则表达式基本符号及含义 1. **特殊字符**:`^` 和 `$` - `^` 表示匹配字符串的开始。 - `$` 表示匹配...
正则表达式是一种文本模式,包括普通字符(a~z)和特殊字符. 菜鸟教程 B站视频 我有regexbuddy安装包,需要的可以留言 *和+都是贪婪的,会尽可能多的匹配,在他们后面加上?就能变成最小匹配 * 表示这个符号前面的...
8. **正则表达式**:在shell中,正则表达式是进行文本匹配和查找的强大工具。 9. **错误处理和调试**:学会如何处理脚本运行时的错误,以及如何调试脚本。 10. **权限与文件属性**:理解Linux的用户和组权限系统,...
1. 正则表达式:正则表达式中表示单词边界的元字符是 \b。 2. Java 常见的类和接口:String 不是原始基本数据类型,HashMap 允许存放空值、空键,List 接口允许重复,Set 接口不允许重复。 3. BigInteger 类:...
目錄引言01 - 爬虫护理02 - 请求分析流程03 - request模块的使用04 - 数据提取概念和数据的分类05 - JSON数据提取06 - re 正则表达式导出数据实例目录01 - 豆瓣热门爬虫-入门02 - 百度贴吧爬虫-入门03 - 百度翻译...
3. **正则表达式**:使用正则表达式提取器来捕获页面中的动态数据,如用户ID、订单号等。 ##### **4.2 扩展JMeter—透过BeanShell呼叫Java程序动态处理数据** BeanShell是一种轻量级的Java解释器,可以通过...
【PHP采集程序大全 - 菜鸟入门指南】 在互联网数据海量的时代,PHP采集程序,又称"小偷程序",成为获取和处理网络信息的重要工具。对于初学者来说,掌握PHP采集技术不仅可以提升开发能力,还能帮助理解网络数据的...
以上只是Java工具类的一小部分,实际上,Java API中还有许多其他工具类,如`UUID`用于生成全局唯一标识符,`Pattern`和`Matcher`用于正则表达式操作,`System`类提供了系统相关的属性和控制功能等。熟练掌握这些工具...
- 正则表达式是一种强大的文本匹配工具。 - 常用操作包括查找、替换、分割等。 8. **模块与包管理:** - 模块是包含Python代码的文件。 - 包是一组相关模块的集合。 - 使用`import`导入模块或包。 #### 四、...
7. **正则表达式**:Python的re模块提供了正则表达式的相关功能,用于处理和匹配字符串。 8. **网络编程**:Python可以进行网络编程,如HTTP请求、TCP/IP套接字等,如urllib、socket库。 9. **异常处理**:Python...
此外,掌握对象和类的概念,异常处理,文件操作,以及正则表达式等也是重要的部分。 在学习Python之前,对基本的计算机编程术语有所了解是非常有益的,比如变量、条件、循环、函数等。如果之前有PHP或ASP等编程语言...
随着学习深入,教程可能涵盖更高级的主题,如类和对象(面向对象编程)、模块和包的使用、异常处理、文件操作、正则表达式、日期和时间处理。这些知识对于编写复杂的程序至关重要。 三、函数式编程 Python支持函数...
- **标准库**:例如 `os`、`sys`、`re` 等,涵盖了文件操作、系统管理、正则表达式匹配等多种功能。 - **第三方库**:例如 `requests` 用于网络请求、`pandas` 和 `scikit-learn` 用于数据分析和机器学习。 #### ...