`
tcxiang
  • 浏览: 88020 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

regex

 
阅读更多

http://regexpal.com/

 

只保留数字 replace [^0-9]

以 A开头B结尾(包含AB,最小距离)A[\s\S]*?B

以 A开头B结尾(包含AB,最大距离)A[\s\S]*B

以 A开头B结尾(包含AB,最小距离,不包含AB)A([\s\S]*?)B  取group(1)

 

 

一、正则表达式介绍、参考文档

正则表达式参考文档:http://www.regexlab.com/zh/regref.htm

 

二、常用正则表达式大全

正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。

      匹配中文字符的正则表达式: [u4e00-u9fa5]   
  评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 
  匹配双字节字符(包括汉字在内):[^x00-xff] 
  评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 
  匹配空白行的正则表达式:ns*r 
  评注:可以用来删除空白行 
  匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? /> 
  评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力 
  匹配首尾空白字符的正则表达式:^s*|s*$ 
  评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式 
  匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  评注:表单验证时很实用 
  匹配网址URL的正则表达式:[a-zA-z]+://[^s]* 
  评注:网上流传的版本功能很有限,上面这个基本可以满足需求 
  匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 
  评注:表单验证时很实用 
  匹配国内电话号码:d{3}-d{8}|d{4}-d{7} 
  评注:匹配形式如 0511-4405222 或 021-87888822 
  匹配腾讯QQ号:[1-9][0-9]{4,} 
  评注:腾讯QQ号从10000开始 
  匹配中国邮政编码:[1-9]d{5}(?!d) 
  评注:中国邮政编码为6位数字 
  匹配身份证:d{15}|d{18} 
  评注:中国的身份证为15位或18位 
  匹配ip地址:d+.d+.d+.d+ 
  评注:提取ip地址时有用 
  匹配特定数字: 
  ^[1-9]d*$    //匹配正整数 
  ^-[1-9]d*$   //匹配负整数 
  ^-?[1-9]d*$   //匹配整数 
  ^[1-9]d*|0$  //匹配非负整数(正整数 + 0) 
  ^-[1-9]d*|0$   //匹配非正整数(负整数 + 0) 
  ^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数 
  ^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数 
  ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数 
  ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0) 
  ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0) 
  评注:处理大量数据时有用,具体应用时注意修正 
  匹配特定字符串: 
  ^[A-Za-z]+$  //匹配由26个英文字母组成的字符串 
  ^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串 
  ^[a-z]+$  //匹配由26个英文字母的小写组成的字符串 
  ^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串 
  ^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串 
  在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下: 
  只能输入数字:“^[0-9]*$” 
  只能输入n位的数字:“^d{n}$” 
  只能输入至少n位数字:“^d{n,}$” 
  只能输入m-n位的数字:“^d{m,n}$” 
  只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$” 
  只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$” 
  只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$” 
  只能输入非零的正整数:“^+?[1-9][0-9]*$” 
  只能输入非零的负整数:“^-[1-9][0-9]*$” 
  只能输入长度为3的字符:“^.{3}$” 
  只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$” 
  只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$” 
  只能输入由26个小写英文字母组成的字符串:“^[a-z]+$” 
  只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$” 
  只能输入由数字、26个英文字母或者下划线组成的字符串:“^w+$” 
  验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度在6-18之间, 
  只能包含字符、数字和下划线。 
  验证是否含有^%&'',;=?$"等字符:“[^%&'',;=?$x22]+” 
  只能输入汉字:“^[u4e00-u9fa5],{0,}$” 
  验证Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 
  验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 
  验证电话号码:“^((d{3,4})|d{3,4}-)?d{7,8}$” 
  正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”, 
  “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。 
  验证身份证号(15位或18位数字):“^d{15}|d{}18$” 
  验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12” 
  验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$” 
  正确格式为:“01”“09”和“1”“31”。 
  匹配中文字符的正则表达式: [u4e00-u9fa5] 
  匹配双字节字符(包括汉字在内):[^x00-xff] 
  匹配空行的正则表达式:n[s| ]*r 
  匹配HTML标记的正则表达式:/<(.*)>.*|<(.*) />/ 
  匹配首尾空格的正则表达式:(^s*)|(s*$) 
  匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)? 
  (1)应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 
  String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;} 
  (2)应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现 
  String.prototype.trim = function() 
  { 
  return this.replace(/(^s*)|(s*$)/g, ""); 
  } 
  (3)应用:利用正则表达式分解和转换IP地址 
  function IP2V(ip) //IP地址转换成对应数值 
  { 
  re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式 
  if(re.test(ip)) 
  { 
  return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1 
  } 
  else 
  { 
  throw new Error("Not a valid IP address!") 
  } 
  } 
  (4)应用:从URL地址中提取文件名的javascript程序 
  s="http://www.9499.net/page1.htm"; 
  s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2") ;//Page1.htm 
  (5)应用:利用正则表达式限制网页表单里的文本框输入内容 
  用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^u4E00-u9FA5]/g,''))" 
  用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^uFF00-uFFFF]/g,''))" 
  用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste= "clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,''))" 
  用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,''

 

三、几款免费在线正则表达式测试工具

    http://regexpal.com/ 
    http://www.nregex.com/
    http://regex.larsolavtorvik.com/
    http://www.myregexp.com/
    http://www.rubular.com/
    http://osteele.com/tools/reanimator

分享到:
评论

相关推荐

    regex.h regex.cpp

    在本案例中,"regex.h" 和 "regex.cpp" 是两个关键文件,它们分别代表了C语言中处理正则表达式的头文件和源文件。 `regex.h` 头文件是C语言中使用正则表达式的关键接口,它包含了所有与正则表达式相关的函数声明和...

    linux下的C语言POSIX正则表达式头文件和源文件: regex.h regex.cpp

    在本主题中,我们将探讨`regex.h`头文件和`regex.cpp`源文件,以及如何在Visual Studio 2010或2012环境下编译它们。 首先,`regex.h`是包含POSIX正则表达式函数声明的头文件。在Linux中,这个头文件定义了几个关键...

    正则表达式测试工具regex101

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、搜索和替换等场景。在IT行业中,掌握正则表达式是提高工作效率的关键技能之一。`regex101`是一个在线的...

    C++正则表达式-regex类(不依赖其他库)

    在这个特定的案例中,我们关注的是`regex`类,它是C++ `&lt;regex&gt;`库的一部分,用于实现正则表达式操作。这个压缩包文件包含了一个名为`regex.h`的头文件,以及`release`和`debug`两个目录,这通常意味着它提供了编译...

    用于windows的posix regex C库

    标题提到的“用于windows的posix regex C库”就是为了解决这个问题。 这个C库可能包含了以下关键组件: 1. **头文件**(`include`目录):这些头文件提供了函数原型和宏定义,使得开发者可以在C程序中调用POSIX...

    正则表达式(regex)C语言源码,超强查找/替换算法

    正则表达式(Regular Expression,简称regex)是编程领域中一种强大的文本处理工具,它用于在字符串中查找、替换或匹配特定模式。在C语言中,实现正则表达式功能通常需要借助第三方库,比如本案例中提到的Henry ...

    Cpp regex usge demo

    在C++编程语言中,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,用于模式匹配、查找、替换和提取字符串中的特定模式。STL(Standard Template Library)库是C++的一个重要组成部分,它...

    java 正则表达式应用jar包 regex-smart.jar

    在Java中,正则表达式是通过java.util.regex包提供的接口和类来实现的。`regex-smart.jar`这个库显然是为了简化开发者在Java项目中使用正则表达式的流程,它提供了一系列内置的验证、提取和清洗方法,使得处理字符串...

    regex-2022.6.2-cp311-cp311-win_amd64.whl.zip

    标题中的"regex-2022.6.2-cp311-cp311-win_amd64.whl.zip"是一个Python软件包的压缩文件,它包含了Python的正则表达式库regex的特定版本。这个版本是2022年6月2日发布的,适用于Python 3.11解释器,并且是为Windows ...

    超好用的正则表达式测试工具Code Architects Regex Tester

    正则表达式(Regular Expression,简称Regex)是用于在文本中搜索、匹配、替换特定模式的强大工具。在编程和数据处理领域,它被广泛应用来验证输入、提取信息或执行复杂的数据清洗任务。Code Architects Regex ...

    正则表达式安全漏洞测试工具SDL Regex Fuzzer

    免费工具 SDL Regex Fuzzer 用以帮助程序员测试他们的正则表达式是否存在 DoS 漏洞。 正则表达式模式中包含了某些执行起来极其耗时(指数时间)条款,(例如:分组条款中包含重复自身的重复)。这可能导致被攻击者...

    regex-2022.6.2-cp39-cp39-win_amd64.whl.zip

    标题 "regex-2022.6.2-cp39-cp39-win_amd64.whl.zip" 暗示了这是一个与正则表达式(regex)相关的Python库的更新版本,用于Windows平台的AMD64架构。描述中的内容与标题相同,进一步确认了这是针对Python 3.9版本的...

    Regex Expression(正则表达式)

    Regular expression 具有可以表达出难以描述、複杂、但是却有特殊规则的字串的功能,所以许多的 UNIX 工具程式都有支援 Regular expression 的功能。例如 ex 、 vi 、 sed 、 awk 、 grep ...这里有文件Regex.h,Regex.c

    TestRegex_regex_C#_

    在IT行业中,正则表达式(Regex)是一种强大的文本处理工具,用于匹配、查找、替换或提取特定模式的字符串。C# 是一种广泛使用的编程语言,它提供了丰富的支持来处理正则表达式。"TestRegex_regex_C#" 这个标题表明...

    GNU regex windows编译

    在IT领域,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,用于匹配、查找、替换或提取特定模式的字符串。GNU regex库是GNU项目中的一个组件,提供了跨平台的正则表达式处理功能。这个...

    regex++ document (boost)

    《regex++文档(Boost库)详解》 在编程领域,正则表达式(Regex)是一种强大的文本处理工具,用于模式匹配、查找、替换等操作。Boost库中的`regex++`是C++中实现正则表达式的高效库,它提供了丰富的功能和高度的灵活...

    C++Regex正则表达式

    C++中的正则表达式(Regex)是一种强大的文本处理工具,它允许程序员通过模式匹配来搜索、替换或分割字符串。正则表达式在C++中是通过标准库 `&lt;regex&gt;` 提供的,这个库提供了丰富的功能,使得处理复杂的文本模式变得...

    C语言在Visual Studio 2010环境下使用regex.h正则表达式函数库

    在Visual Studio 2010环境下,我们可以使用`regex.h`头文件来引入PCRE(Perl Compatible Regular Expressions)库,从而实现正则表达式的匹配和操作。以下是对这个主题的详细讲解: 1. **PCRE库介绍** PCRE是一个...

    GNU regex 正则表达式 修正版

    GNU regex正则表达式修正版是对原GNU regex 0.13版本的改进,主要解决了在编译过程中出现的大批量警告错误。这个修正版不仅优化了源代码,提高了代码质量,还增强了其兼容性,使其能够顺利在Windows和Linux两大操作...

    正则表达式测试工具RegexTester 中文版

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、搜索和替换等场景。RegexTester是一款强大的正则表达式测试工具,专为帮助用户验证和调试正则表达式设计。...

Global site tag (gtag.js) - Google Analytics