public static void main(String[] args) {
String s = "哈哈!@#W";
s = s.replaceAll("\\pP", "");
System.out.print(s);
}
注:从他人处学习到的。
采用 Unicode 标点属性方式的正则表达式,可以去掉所有的标点符号,
包括全角、半角、横排、竖排等的标点符号。
注意一下,如果在 JDK 5 或以下的环境中,全角单引号对、双引号对
无法替换掉,这是 JDK 5 及以下版本缺失的,在 JDK 6 中由于加入了
Pi 和 Pf 两个 Unicode 子属性,因此就能替换掉。
在 JDK 6 以下的版本中可以这样:
Java code
str = str.replaceAll("[\\pP‘’“”]", "");
\\pP解释
Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:……
分享到:
相关推荐
在探讨如何利用正则表达式来判断一个字符串除指定字符外不包含其他特殊字符之前,我们首先需要了解正则表达式的基本概念以及本场景中的具体需求。 ### 正则表达式简介 正则表达式是一种强大的文本处理工具,能够...
正则表达式是一种强大的文本处理工具,用于模式匹配、搜索、替换等操作,在软件开发、数据处理、网络爬虫等领域有着广泛的应用。在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的...
### 正则表达式知识点详解 #### 一、正则表达式基础介绍 正则表达式(Regular Expression)是一种强大的文本处理工具,在编程语言中被广泛应用于字符串的搜索与替换等操作。它能够帮助开发者快速定位、提取或验证...
这包括所有的大写和小写字母字符,所有数字,所有标点符号以及一些符号。 * 非打印字符:\cx 匹配由 x 指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。 * 特殊字符:所谓特殊字符,就是一些有特殊含义的...
1. **基本字符**:包括字母、数字、标点符号等。例如,"abc123"就是一个简单的正则表达式,匹配包含这些字符的字符串。 2. **特殊字符**:如`\d`代表数字,`\w`代表字母或数字,`\s`代表空白字符。例如,`\d+\w+`...
在正则表达式中,许多标点符号都有特殊的含义,可以用反斜杠 (\) 开头的转义序列来表示某些非字母字符。 字符类是将单独的直接符放进中括号内就可以组合成字符类。一个字符类和它所包含的任何一个字符都匹配。另外...
3. **文本匹配和查找**:程序会使用用户提供的正则表达式去扫描文本,找出所有匹配的子串,并高亮显示。 4. **统计分析**:分析程序可能还统计了匹配到的模式数量,提供频率分布,帮助用户了解文本中的模式分布。 ...
### Java过滤特殊字符的正则表达式知识点解析 #### 一、正则表达式简介 正则表达式是一种用于描述字符串模式的强大工具,在文本搜索、替换等操作中有着广泛的应用。Java 中提供了丰富的 API 来支持正则表达式的使用...
在JavaScript、Python、Java等语言中,我们可以构建以下正则表达式来匹配中文汉字: 1. 匹配GB2312编码范围内的汉字: ```regex /[\uB0A1-\uF7FE]/ ``` 2. 匹配GBK编码范围内的汉字: ```regex /[\u8140-\...
4.正则表达式的基本组成:普通字符(如字母、数字、标点符号)、特殊字符(如.、*、+、?、|、()、[]、{})、转义字符(如\d、\w、\s)。 如何学习 从基础开始,理解正则表达式的定义和用途,掌握基本组成元素。 ...
Java提供了多种预定义字符类,如`\p{Alpha}`(匹配任何字母字符),`\p{Digit}`(匹配任何数字)和`\p{Punct}`(匹配任何标点符号)等,这些字符类可以极大地简化正则表达式的编写。 三、组和反向引用 1. 组:使用...
字符包括普通字符(如字母、数字)和特殊字符(如空格、标点符号)。元字符有特殊含义,例如`.`代表任意字符,`^`表示行首,`$`表示行尾,`\d`代表数字等。量词如`*`、`+`、`?`用于控制匹配次数,分别表示零次或多次...
### Java正则表达式知识点详解 #### 一、正则表达式概述 正则表达式是一种强大的文本处理工具,能够帮助我们完成各种复杂的字符串搜索、替换等操作。Java中的正则表达式支持丰富的语法和特性,可以高效地进行模式...
这包括所有的大写和小写字母字符,所有数字,所有标点符号以及一些符号。 3.2 非打印字符:包括换页符、换行符、回车符、制表符、垂直制表符等等。 3.3 特殊字符:一些有特殊含义的字符,如上面说的”*.txt”中的*...
1. 基本字符:正则表达式由一系列基本字符构成,如字母、数字、标点符号等。例如,字符"a"、"b"和"1"都是基本字符。 2. 量词:量词用于指定前面字符或字符组出现的次数。常见的量词有: - `*`:表示前面的字符可以...
11. **在不同语言中的实现**:正则表达式在不同的编程语言中实现可能略有差异,如JavaScript、Python、Java、Perl等都有自己的正则表达式库。 通过学习以上内容,你可以对正则表达式有基本的理解,并能编写简单的...