地址:http://topic.csdn.net/u/20080925/15/41b814bf-fcaf-4b37-be91-10561a102768.html
摘抄:
str = str.replaceAll("[\\pP‘’“”]", "");
Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:符号(比如数学符号、货币符号等);
N:数字(比如阿拉伯数字、罗马数字等);
C:其他字符
上面这七个是属性,七个属性下还有若干个子属性,用于更进一步地进行细分。
Java 中用于 Unicode 的正则表达式数据都是由 Unicode 组织提供的。
Unicode 正则表达式标准(可以找到所有的子属性)
http://www.unicode.org/reports/tr18/
各 Unicode 字符属性的定义,可以用一看看某个字符具有什么属性。
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
这个文本文档一行是一个字符,第一列是 Unicode 编码,第二列是字符名,第三列是 Unicode 属性,
以及其他一些字符信息。
分享到:
相关推荐
例如,`matches()`方法会检查整个输入字符串是否完全符合正则表达式,而`find()`则会在输入字符串中查找第一个匹配的部分。 在Java中,正则表达式的语法相当丰富,包括但不限于: 1. 字符集:`[]`用来定义一组字符...
本文将深入探讨易语言中的正则表达式匹配中文的原理、方法以及应用。 正则表达式(Regular Expression)是一种模式匹配的语言,用于描述一种字符串的集合。在易语言中,我们可以通过内置的字符串函数来实现正则...
在易语言中,正则表达式类是一个非常重要的工具,用于处理字符串的模式匹配和查找。在处理中文文本时,这个功能尤为关键,因为中文字符的编码和处理方式与英文有所不同。 正则表达式是用于匹配字符串模式的一种强大...
正则表达式是一种强大的文本处理工具,用于在字符串中进行模式匹配和查找、替换等操作。在编程和数据处理领域,正则表达式是不可或缺的一部分,尤其在处理大量文本数据时,它的灵活性和效率尤为突出。为了更好地理解...
对于每个正则表达式符号,我们都需要定义相应的状态转换规则。例如,对于字符集 `[abc]`,我们需要为每个字符创建一个状态,并从起始状态向这三个状态分别添加边。对于量词,如 `a*`,我们需要创建一个循环,从包含 ...
正则表达式是处理字符串的强大工具,它允许我们对字符串进行匹配、搜索、替换等操作。在JavaScript中,正则表达式以斜杠“/”包围的形式出现,例如`/pattern/flags`。在处理HTML文档时,经常会遇到需要从HTML代码中...
Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作技巧。 一、正则表达式简介 正则表达式是指一...
综上所述,本文的工作在正则表达式匹配技术的发展中起到了积极作用,为处理网络中的大规模数据提供了新的解决方案。通过FPGA实现的正则表达式匹配引擎不仅可以应用在网络入侵检测系统中,还可以扩展到其他需要模式...
接着,定义了一个名为`SocialSecurityNumberValidator`的类,在主方法中使用`Pattern.compile`编译正则表达式,并使用`matcher.matches`来检查字符串是否与给定的模式匹配。 通过上述知识点的学习,读者可以了解到...
正则表达式匹配器,自己开发的小工具,.net 4.0支持
而本软件正是把强大的正则功能完美地添加到表格中,让 Excel、WPS 支持正则表达式的搜索、匹配提取、替换、定位等,让数据处理能力进化一个层次! 让 Office Excel、WPS 表格支持正则表达式的免费插件:「Excel ...
在IT行业中,正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配、查找、替换等操作。在本案例中,“易语言正则表达式取网址和名称”指的是使用易语言这一编程环境,结合正则表达式技术来从文本中...
java通过正则表达式匹配获取MAC(支持windows和Linux)
正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它用于匹配字符串模式,广泛应用于数据验证、搜索、替换等场景。在IT行业中,掌握正则表达式是提高工作效率的重要技能之一。 正则表达式的...
文档“基于FPGA的正则表达式匹配算法综述.pdf”详细介绍了硬件正则表达式匹配的优势,FPGA在正则表达式匹配算法中的基本思想和设计方法。文档根据匹配速度和资源利用率对现有算法进行了分类,并对当前主流算法的优...
经典算法是最早被提出的几种正则表达式匹配算法,包括Thompson的NFA模拟、传统的DFA模拟以及混合方法。 ##### Thompson的NFA模拟 Thompson的NFA模拟算法是由Thompson于1968年提出的,通过构建非确定有限自动机...
在Lucene中,可以通过`regexQuery`来利用正则表达式进行复杂条件的匹配,从而实现更精确的搜索需求。 #### regexQuery详解 `regexQuery`是Lucene提供的一个用于执行正则表达式查询的方法。它接受一个`Term`对象作为...
通过研究这个文件,开发者可以了解如何在PowerBuilder 11.5中构建自己的正则表达式解决方案。 在PowerBuilder中,没有内置的正则表达式引擎,因此通常需要借助第三方库,如PBDOM、PBRegex等。这些库提供了类似Java...
正则表达式是一种强大的文本匹配工具,它可以简洁地表示复杂的搜索模式。通过使用正则表达式,可以简化上述例子中的SQL查询语句。例如,同样的查询可以使用如下语句完成: ```sql SELECT * FROM Tablel WHERE name ...