摘抄:
str = str.replaceAll("[\\pP‘’“”]", "");
Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:符号(比如数学符号、货币符号等);
N:数字(比如阿拉伯数字、罗马数字等);
C:其他字符
上面这七个是属性,七个属性下还有若干个子属性,用于更进一步地进行细分。
Java 中用于 Unicode 的正则表达式数据都是由 Unicode 组织提供的。
Unicode 正则表达式标准(可以找到所有的子属性)
http://www.unicode.org/reports/tr18/
各 Unicode 字符属性的定义,可以用一看看某个字符具有什么属性。
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
这个文本文档一行是一个字符,第一列是 Unicode 编码,第二列是字符名,第三列是 Unicode 属性,
以及其他一些字符信息。
分享到:
相关推荐
本文实例讲述了js正则匹配中文标点符号的方法。分享给大家供大家参考,具体如下: 运行效果截图如下: 具体代码如下: <html> <head> <meta http-equiv="content-type" content="text/html;charset...
例如,使用“正则表达式匹配”命令可以对字符串进行模式匹配,判断是否符合预设的规则。这个命令接受两个参数:一个是待检测的字符串,另一个是正则表达式模式。 对于匹配中文,我们需要了解中文字符的编码。在...
正则表达式规则 1.1 普通字符 字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。 举例1:表达式 "c",...
1. 基本字符:如字母、数字、标点符号等,它们按照原义匹配文本。 2. 特殊字符(元字符):如`.`代表任意字符,`^`表示行首,`$`表示行尾,`\d`代表数字等,它们拥有特殊的含义。 3. 量词:如`*`代表零个或多个,`+`...
如"[[:alpha:]]"匹配任何字母,"[[:digit:]]"匹配数字,"[[:alnum:]]"匹配字母和数字,"[[:space:]]"匹配空白字符,"[[:upper:]]"匹配大写字母,"[[:lower:]]"匹配小写字母,"[[:punct:]]"匹配标点符号,以及"[[:...
限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配: - `*`:匹配前面的子表达式零次或多次。例如,`zo*`能匹配“z”以及“zoo”。`*`等价于`{0,}`。 - `+`:匹配前面的子表达式一次或多次。...
正则表达式是一种强大的文本处理工具,用于在字符串中进行模式匹配、查找、替换和提取信息。它在各种操作系统和编程语言中都有广泛的应用,如*nix系统(Linux、Unix等)、HP操作系统、PHP、C#、Java等。虽然正则...
- `\p(name)` 表示在具有给定名称的类中任何字符,其中 name 可以是 "Alnum", "Alpha" 字母, "ASCII", "Blank" 空格, "Digit" 数字, "Graph" 图表, "Print" 打印, "Punct" 标点, "Upper" 大写, "XDigit" 十六进制...
题目要求使用正则表达式来匹配只包含中文、数字、字母以及下划线的字符串。这里涉及到的具体知识点包括: 1. **中文字符的匹配**:在Unicode编码中,中文字符通常位于`\u4e00`到`\u9fa5`之间。因此,要匹配一个中文...
- **$2"xyz"**:示例中表示在正则表达式的开头匹配了"abc"之后的"xyz"。 - **$`**:匹配前的字符串部分。 - **$'**:匹配后的字符串部分。 - **$+**:最后一次匹配的结果。 - **$&**:整个匹配的结果。 #### 十三、...
在Java中,进行正则表达式匹配是一个强大的功能,可以通过正则表达式实现对中文字符、标点符号以及引号等的匹配。通过给出的实例,我们可以深入了解如何在Java中使用正则表达式来匹配特定模式的字符串,尤其是涉及到...
文档中提供了详细的正则匹配规则表,涵盖了基本字符规则、预定义字符集、常用字符集、数量词、边界匹配器、逻辑、分组、非捕获组与环视等。 正则表达式是用一些特定字符的组合,组成一个“规则字符串”表达对字符串...
无论数字前后是否有标点符号,`\b\d+\b`都能正确匹配。 4. 匹配价格并计算平均价格: - 文中还提到了使用正则表达式匹配价格并计算平均价格的方法。具体地,通过`re.findall`函数找到所有符合条件的价格数字,然后...
这个正则表达式使用了字符类([])来匹配所有的标点符号。字符类中包含了空格(` `)、波浪线(`~`)、反引号(`` ` ``)、感叹号(`!`)、@、#、$、%、^、&、*、(、)、-、_、+、=、|、\、[、]、{、}、;、:、"、'、...
正则表达式是一种强大的文本处理工具,用于模式匹配、搜索、替换等操作,在软件开发、数据处理、网络爬虫等领域有着广泛的应用。在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的...
正则表达式是一种用来描述字符串匹配模式的工具。它通过定义一系列规则来匹配字符串中的特定字符序列。在JavaScript中,正则表达式常用于执行字符串搜索、替换和验证等多种操作。 #### URL正则表达式示例 1. **方法...
在 Oracle 数据库中,正则表达式是一种强大的模式匹配工具,可以帮助用户快速搜索、替换和验证数据。从 Oracle 10g 开始,Oracle 内建了符合 IEEE POSIX (Portable Operating System for Unix)标准的正则表达式,...