`
k1280000
  • 浏览: 202702 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

中文的正则表达式

 
阅读更多

此表达式也行  \\p{InCJKUnifiedIdeographs}&&\\P{Cn}]]

http://www.24xuexi.com/w/2011-05-11/89578.html

 

匹配中文字符的正则表达式: [u4e00-u9fa5]( 转)

http://blog.csdn.net/xiaofan_sap/article/details/4810815

 

  1. 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了   
  2.   匹配双字节字符(包括汉字在内):[^x00-xff]   
  3.   评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)   
  4.   匹配空白行的正则表达式:ns*r   
  5.   评注:可以用来删除空白行   
  6.   匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?|<.*? />   
  7.   评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力   
  8.   匹配首尾空白字符的正则表达式:^s*|s*$   
  9.   评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式   
  10.   匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*   
  11.   评注:表单验证时很实用   
  12.   匹配网址URL的正则表达式:[a-zA-z]+://[^s]*   
  13.   评注:网上流传的版本功能很有限,上面这个基本可以满足需求   
  14.   匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$   
  15.   评注:表单验证时很实用   
  16.   匹配国内电话号码:d{3}-d{8}|d{4}-d{7}   
  17.   评注:匹配形式如 0511-4405222 或 021-87888822   
  18.   匹配腾讯QQ号:[1-9][0-9]{4,}   
  19.   评注:腾讯QQ号从10000开始   
  20.   匹配中国邮政编码:[1-9]d{5}(?!d)   
  21.   评注:中国邮政编码为6位数字   
  22.   匹配身份证:d{15}|d{18}   
  23.   评注:中国的身份证为15位或18位   
  24.   匹配ip地址:d+.d+.d+.d+   
  25.   评注:提取ip地址时有用   
  26.   匹配特定数字:   
  27.   ^[1-9]d*$    //匹配正整数   
  28.   ^-[1-9]d*$   //匹配负整数   
  29.   ^-?[1-9]d*$   //匹配整数   
  30.   ^[1-9]d*|0$  //匹配非负整数(正整数 + 0)   
  31.   ^-[1-9]d*|0$   //匹配非正整数(负整数 + 0)   
  32.   ^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数   
  33.   ^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数   
  34.   ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数   
  35.   ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0)   
  36.   ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0)   
  37.   评注:处理大量数据时有用,具体应用时注意修正   
  38.   匹配特定字符串:   
  39.   ^[A-Za-z]+$  //匹配由26个英文字母组成的字符串   
  40.   ^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串   
  41.   ^[a-z]+$  //匹配由26个英文字母的小写组成的字符串   
  42.   ^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串   
  43.   ^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串   
  44.   在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:   
  45.   只能输入数字:“^[0-9]*$”   
  46.   只能输入n位的数字:“^d{n}$”   
  47.   只能输入至少n位数字:“^d{n,}$”   
  48.   只能输入m-n位的数字:“^d{m,n}$”   
  49.   只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”   
  50.   只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$”   
  51.   只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$”   
  52.   只能输入非零的正整数:“^+?[1-9][0-9]*$”   
  53.   只能输入非零的负整数:“^-[1-9][0-9]*$”   
  54.   只能输入长度为3的字符:“^.{3}$”   
  55.   只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$”   
  56.   只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”   
  57.   只能输入由26个小写英文字母组成的字符串:“^[a-z]+$”   
  58.   只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”   
  59.   只能输入由数字、26个英文字母或者下划线组成的字符串:“^w+$”   
  60.   验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度在6-18之间,   
  61.   只能包含字符、数字和下划线。   
  62.   验证是否含有^%&',;=?$"等字符:“[^%&',;=?$x22]+”   
  63.   只能输入汉字:“^[u4e00-u9fa5],{0,}$”   
  64.   验证Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”   
  65.   验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”   
  66.   验证电话号码:“^((d{3,4})|d{3,4}-)?d{7,8}$”   
  67.   正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,   
  68.   “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。   
  69.   验证身份证号(15位或18位数字):“^d{15}|d{}18$”   
  70.   验证一年的12个月:“^(0?[1-9]|1[0-2])$”正确格式为:“01”-“09”和“1”“12”   
  71.   验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”   
  72.   正确格式为:“01”“09”和“1”“31”。   
  73.   匹配中文字符的正则表达式: [u4e00-u9fa5]   
  74.   匹配双字节字符(包括汉字在内):[^x00-xff]   
  75.   匹配空行的正则表达式:n[s| ]*r   
  76.   匹配HTML标记的正则表达式:/<(.*)>.*|<(.*) />/   
  77.   匹配首尾空格的正则表达式:(^s*)|(s*$)   
  78.   匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*   
  79.   匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?   
  80.   (1)应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)   
  81.   String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}   
  82.   (2)应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现   
  83.   String.prototype.trim = function()   
  84.   {   
  85.   return this.replace(/(^s*)|(s*$)/g, "");   
  86.   }   
  87.   (3)应用:利用正则表达式分解和转换IP地址   
  88.   function IP2V(ip) //IP地址转换成对应数值   
  89.   {   
  90.   re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式   
  91.   if(re.test(ip))   
  92.   {   
  93.   return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1   
  94.   }   
  95.   else   
  96.   {   
  97.   throw new Error("Not a valid IP address!")   
  98.   }   
  99.   }   
  100.   (4)应用:从URL地址中提取文件名的javascript程序   
  101.   s="http://www.9499.net/page1.htm";   
  102.   s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2") ;//Page1.htm   
  103.   (5)应用:利用正则表达式限制网页表单里的文本框输入内容   
  104.   用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,'))"   
  105.   用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,'))"   
  106.   用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^d]/g,') "onbeforepaste= "clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,'))"   
  107.   用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[W]/g,') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,' 

分享到:
评论

相关推荐

    PB实现的正则表达式

    在IT领域,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它能够进行复杂的模式匹配、查找、替换等操作。在本话题中,我们将探讨如何使用PowerBuilder 11.5这一经典的开发环境来实现正则...

    qt使用正则表达式限制lineEdit的输入,对正则表达式进行了封装,可以直接引入,工程编译正常

    在Qt框架中,正则表达式(Regular Expression)是一种强大的文本处理工具,它允许程序员以结构化的方式匹配、查找、替换或验证字符串。本项目针对Qt的lineEdit组件,通过正则表达式实现了输入限制功能,使得lineEdit...

    易语言正则表达式类匹配中文

    例如,对于一个新闻网站,可以利用正则表达式类匹配中文源码来提取文章标题或关键词,或者在用户输入的搜索查询中进行模糊匹配,提高搜索效率。 通过易语言提供的正则表达式类,我们可以高效地处理中文文本,进行...

    正则表达式大全 - 收集的最常用正则表达式

    1. 匹配中文字符:`[u4e00-u9fa5]` - 这个正则表达式用于匹配所有中文字符,包括简体和繁体。它基于Unicode范围,u4e00到u9fa5涵盖了大部分常用汉字。 2. 匹配双字节字符:`[^x00-xff]` - 用于匹配包括汉字在内的...

    易语言正则表达式匹配中文

    在易语言中,正则表达式是进行文本处理、数据提取和搜索的关键工具,尤其在处理中文字符时显得尤为重要。本文将深入探讨易语言中的正则表达式匹配中文的原理、方法以及应用。 正则表达式(Regular Expression)是一...

    精通正则表达式(第三版)简体中文版

    本书《精通正则表达式(第三版)简体中文版》主要介绍了正则表达式的概念、语法以及如何在不同的环境中高效地使用正则表达式。 #### 二、正则表达式的语法基础 1. **元字符**:正则表达式中的特殊字符,用于指定...

    易语言正则表达式文本替换

    例如,"子程序_正则文本替换"可能就是一个易语言中用于执行正则表达式替换的子程序,它接收输入的文本、正则表达式模式和替换字符串,然后返回经过替换操作的新文本。 1. **正则表达式基础** - **元字符**:如`.`...

    正则表达式大全.docx

    8. Unicode汉字范围:`/^[u4e00-u9fa5],{0,}$/` 和匹配中文字符的正则表达式:`[\u4e00-\u9fa5]` - 这两个正则表达式用于检测字符串中是否包含中文字符。 9. 匹配双字节字符:`[^\x00-\xff]` - 用于识别多字节字符...

    常用正则表达式大全.txt

    根据提供的文件信息,我们可以整理出一系列与正则表达式相关的知识点。这些知识点涵盖了从基本的数字验证到复杂的字符串匹配等多个方面。下面是详细的知识点总结: ### 基本概念 正则表达式是一种用于文本模式匹配...

    C#正则表达式大全, 判断字符串是否为正整数,中文,英文.....

    C# 正则表达式大全 正则表达式是指用来描述字符串模式的表达式,通过使用正则表达式,我们可以轻松地实现字符串的匹配、验证、提取和替换等操作。在 C# 中,我们可以使用 System.Text.RegularExpressions 命名空间...

    精通正则表达式中文版英文版_中文版为扫描版

    中文版《精通正则表达式》(第3版)可能以扫描版的形式存在,这意味着它可能包含扫描的图片,阅读体验可能会受到影响,但依然能帮助中文读者理解复杂的正则表达式概念。英文版则是电子版,适合英文阅读流畅的人士,其...

    VC++支持中文的正则表达式函数库

    在本案例中,"VC++支持中文的正则表达式函数库" 提供了一个专门为VC++(Visual C++)设计的正则表达式库,尤其值得注意的是,它特别优化了对中文字符的支持。 这个库由一位大陆程序员编写并开源,作者为了促进技术...

    正则表达式(一)从初学到精通正则表达式

    本文将对正则表达式的基础知识进行详细的介绍,从什么是正则表达式开始,逐步深入浅出地讲解正则表达式的基本概念、正则表达式引擎、文字符号、特殊字符、不可显示字符、正则表达式引擎的内部工作机制等。...

    boost库中的正则表达式

    在C++编程中,Boost库是一个非常重要的工具集,提供了许多高级功能,其中包括对正则表达式的支持。Boost库中的正则表达式模块提供了一种高效且强大的方式来处理文本模式匹配。本节将深入探讨Boost库中的正则表达式...

    正则表达式不包涵特殊字符(除了 指定字符 以外)

    这个正则表达式的作用是确保整个字符串只包含数字、英文字母、指定的特殊字符(本例中为 `_`)以及中文字符,并且这些字符至少出现一次。 ### 示例与验证 假设我们要验证以下几组数据是否符合上述规则: 1. **...

    正则表达式只可以输入只允许输入中文、数字、字母、下划线

    题目要求使用正则表达式来匹配只包含中文、数字、字母以及下划线的字符串。这里涉及到的具体知识点包括: 1. **中文字符的匹配**:在Unicode编码中,中文字符通常位于`\u4e00`到`\u9fa5`之间。因此,要匹配一个中文...

    日期正则表达式(很实用)

    ### 日期正则表达式详解 #### 一、基本概念 正则表达式是一种用于文本模式匹配的强大工具,在处理字符串时极为有用。日期格式验证是正则表达式常见应用场景之一,尤其是在表单验证、数据清洗等领域。本文将详细...

    中文正则表达式简单易懂

    ### 正则表达式在Python中的应用 #### 一、正则表达式的概念与起源 正则表达式(Regular Expression,简称RE),是一种强大的文本处理工具,在计算机科学领域有着广泛的应用。它允许用户灵活地检查或者操作字符串...

    精通正则表达式 中英文

    《精通正则表达式》是系统学习正则表达式的唯一最权威著作。任何时候,任何地方,只要提到正则表达式著作,人们都会提到这本书。该书质量之高,声誉之盛,使得几乎没有人企图挑战它的地位,从而在正则表达式图书领域...

    正则表达式 Java 判断字串是否合理

    `checkChineseName`方法用于验证是否为有效的中文姓名,正则表达式为: ```java "^[\u4e00-\u9fa5]+$" ``` 这个表达式利用Unicode范围来匹配中文字符,`[\u4e00-\u9fa5]`表示所有常用汉字的Unicode编码范围。 ### 6...

Global site tag (gtag.js) - Google Analytics