str = str.replaceAll("[\\pP‘’“”]", "");
Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:符号(比如数学符号、货币符号等);
N:数字(比如阿拉伯数字、罗马数字等);
C:其他字符
上面这七个是属性,七个属性下还有若干个子属性,用于更进一步地进行细分。
Java 中用于 Unicode 的正则表达式数据都是由 Unicode 组织提供的。
Unicode 正则表达式标准(可以找到所有的子属性)
http://www.unicode.org/reports/tr18/
各 Unicode 字符属性的定义,可以用一看看某个字符具有什么属性。
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
这个文本文档一行是一个字符,第一列是 Unicode 编码,第二列是字符名,第三列是 Unicode 属性,
以及其他一些字符信息。
原文:http://hi.baidu.com/niit0532/item/7bdbd3779e90962bd6a89c43
相关推荐
正则表达式是一种强大的文本处理工具,用于模式匹配、搜索、替换等操作,在软件开发、数据处理、网络爬虫等领域有着广泛的应用。在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的...
根据题目描述,我们需要构建一个正则表达式来匹配一段字符串,该字符串除了允许出现特定字符(例如下划线 `_`)之外,不允许包含任何其他特殊字符。这里的“特殊字符”通常指的是那些不在字母数字字符集范围内的符号...
Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。在Java中,正则表达式是通过`java.util.regex`包提供的API来实现的。本PDF文档《Java正则表达式详解》...
正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,用于匹配、查找、替换等操作。在编程和数据分析领域,正则表达式扮演着不可或缺的角色。它通过使用特定的字符模式,能够高效地处理字符串,...
题目要求使用正则表达式来匹配只包含中文、数字、字母以及下划线的字符串。这里涉及到的具体知识点包括: 1. **中文字符的匹配**:在Unicode编码中,中文字符通常位于`\u4e00`到`\u9fa5`之间。因此,要匹配一个中文...
Java正则表达式是Java语言中处理字符串匹配、查找、替换等操作的重要工具。自Java 1.4版本起,Java引入了`java.util.regex`包,为开发者提供了丰富的正则表达式支持。正则表达式是一种特殊的字符序列,它可以描述一...
这样说来,正则表达式 /java/ 就和所有包含子串 "java" 的字符串相匹配。虽然正则表达式中的其它字符不是按照字面意思进行匹配的,但它们都具有特殊的意义。 在正则表达式中,许多标点符号都有特殊的含义。例如,...
正则表达式定义:正则表达式是一种字符串匹配模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符...
在Java中,`java.util.regex`包提供了Pattern和Matcher类,支持正则表达式的编译和匹配操作。 这个NLP正则表达式分析程序可能包含以下功能: 1. **文本预处理**:在分析之前,文本通常需要进行预处理,包括去除...
4.正则表达式的基本组成:普通字符(如字母、数字、标点符号)、特殊字符(如.、*、+、?、|、()、[]、{})、转义字符(如\d、\w、\s)。 如何学习 从基础开始,理解正则表达式的定义和用途,掌握基本组成元素。 ...
### Java正则表达式详细讲解 #### 一、正则表达式概述 正则表达式是一种强大的文本处理工具,能够帮助我们实现对字符串的高级搜索和替换操作。无论是用于数据验证、文本处理还是搜索替换场景,正则表达式都是不可...
### Java正则表达式知识点详解 #### 一、正则表达式概述 正则表达式是一种强大的文本处理工具,能够帮助我们完成各种复杂的字符串搜索、替换等操作。Java中的正则表达式支持丰富的语法和特性,可以高效地进行模式...
#### 五、Java正则表达式基本语法 除了上述示例中的正则表达式之外,还需要了解一些常用的正则表达式语法: - **转义字符**: - `\\`: 反斜杠 - `\t`: 间隔 (tab) - `\n`: 换行 - `\r`: 回车 - **预定义字符类*...
Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本提取、数据清洗等。本资源包含了一系列Java正则...
Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员高效地进行文本匹配、搜索和替换操作。本速查手册旨在提供全面的Java正则表达式相关知识,帮助开发者快速理解和运用。 一、Java正则表达式...
Java正则表达式是编程语言Java中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本提取、数据清洗等。本篇文章将深入探讨Java中正...