引用自:http://blog.csdn.net/java2000_net/article/details/2980725
测试代码如下:
-
class T {
-
public static void main(String... args) {
-
String str = "!!!!去符号标号!!当然。!!..**半角";
- System.out.println(str);
-
System.out.println(str.replaceAll("//p{Punct}", ""));
-
System.out.println(str.replaceAll("//pP", ""));
- }
- }
运行结果
!!!!去符号标号!!当然。!!..**半角
!!去符号标号!!当然。半角
去符号标号当然半角
果子的解释
采用 Unicode 标点属性方式的正则表达式,可以去掉所有的标点符号,
包括全角、半角、横排、竖排等的标点符号。
注意一下,如果在 JDK 5 或以下的环境中,全角单引号对、双引号对
无法替换掉,这是 JDK 5 及以下版本缺失的,在 JDK 6 中由于加入了
Pi 和 Pf 两个 Unicode 子属性,因此就能替换掉。
在 JDK 6 以下的版本中可以这样:
-
str = str.replaceAll("[//pP‘’“”]", "");
我查到的 /pP的说明
分享到:
相关推荐
在Java编程中,字符串的...总之,Java中的字符串全角半角转换是一种基础但实用的操作,有助于处理多语言环境下的文本数据。通过理解字符编码和Unicode,我们可以编写出更灵活和健壮的转换函数,以满足不同项目的需求。
#### 一、字符串中汉字与标点符号的判断方法 在进行文本处理时,经常需要判断一个字符串中包含了多少个汉字和标点符号。本篇文章将详细探讨如何实现这一功能,并深入理解其中涉及的Unicode编码知识。 #### 二、...
4. **正则表达式**:在全角半角转换中,正则表达式可以用来匹配特定的字符类别,例如全角数字、字母或标点符号,并将它们转换为对应的半角形式。 5. **自定义函数**:由于PHP的内置函数可能无法满足所有转换需求,...
正则表达式可以匹配全角字母、数字、标点符号等,然后用半角对应字符替换。 ```csharp using System.Text.RegularExpressions; string FullString = "全角字符串"; string HalfString = Regex.Replace(FullString,...
`str_replace()`函数是一个用于查找并替换字符串中特定字符的函数,而`preg_replace()`则是用于执行正则表达式的替换操作。在WordPress中,这两个函数被用来遍历和替换内容中的半角标点符号。它们的使用位置通常在源...
JavaScript作为一种广泛使用的客户端脚本语言,提供了对字符串处理的强大支持,包括全角转半角的转换。 本文将深入探讨如何用JavaScript实现全角转半角的方法,通过示例代码进行解析。 首先,我们要了解全角字符和...
全角字符包括全角数字、英文字母、空格、标点符号等,而半角字符则是常见的ASCII编码字符集。实现该转换的关键在于理解全角字符和半角字符之间的对应关系,并通过程序代码来完成转换。 在这段代码中,定义了一个名...
在C#中,我们可以使用内置的字符串方法或者自定义函数来实现半角到全角、全角到半角的转换。以下是一些示例代码: 1. **半角到全角转换**: ```csharp public static string HalfToFullWidth(string input) { ...
3. 实现字符串全角与半角相互转换的通用函数 为了更加通用和方便地在全角与半角之间转换,可以编写一个函数,允许指定转换的方向(全角转半角或半角转全角): ```php function convertStrType($str, $type) { $dbc...
这里,正则表达式`[^\u4e00-\u9fff]`匹配所有非中文字符,并用`Replace()`方法将它们替换为空字符串,从而达到过滤的效果。 综上所述,VB过滤中文字符串主要涉及字符串处理、字符编码检查以及可能的正则表达式操作...
2. **字符串处理函数**:JavaScript提供了多种字符串处理函数,如`length`属性用于获取字符串长度,但这个长度是基于字节数的,对于全角和半角字符并不区分。开发插件时,可能需要自定义函数来准确计算全角字符的...
对于这些需求,可以结合正则表达式进行预处理,例如使用`re.sub()`去除非字母字符,或使用`str.lower()`进行全角半角、大小写的统一。 标签“字符串出现频率”暗示了这是关于文本分析和数据挖掘的一部分。在大数据...
标点符号是文本中的重要元素,用于表示停顿、语气和连接等,它们可以是全角或半角。 在易语言中,我们可以利用其提供的字符串处理函数来实现字符统计。例如,我们可以用“字符串长度”函数获取整个文本的总字符数,...
- 全角字符通常用于亚洲语言中,这个表达式能够识别并匹配所有非半角的字符,包括全角标点、数字和字母等。 3. **匹配换行符或空白符**:`\n\s*\r` - 可以匹配各种类型的换行和空白字符,如新行、制表符、空格等...
在实际应用中,我们可能还需要考虑全角半角字符、标点符号、数字等。对于全角字符,其Unicode值通常在0xFF01到0xFF5E之间。可以通过增加相应的判断条件来处理。 此外,如果需要统计其他语言的字符,如日文、韩文等...
4. **处理全角半角字符和大小写:** 在实际应用中,我们还需要考虑到全角字符(如中文全角标点)和大小写的差异。可以通过转换字符集(如`mb_strtolower()`)和使用Unicode正则(如`u`修饰符)来处理这些问题。 5. ...
在实际应用中,我们可能还需要考虑到其他复杂情况,例如半角符号、标点、繁体字等。为了解决这些问题,我们可以进一步完善检测函数,例如添加对繁体字的支持,或者通过库如`ilib`来处理更多复杂的字符集。 综上所述...
开发者可能还会考虑到全角字符(双字节字符)和半角字符(单字节字符)的区别,因为全角字符占两个字节,而半角字符占一个字节。 当字数达到或超过预设限制时,比如140个字(这是早期微博的标准字数限制),他们会...
1. **地址预处理**:清理地址中的特殊字符,统一格式,如去除标点符号、空格,转换为全角或半角,标准化地名等。 2. **分词**:使用中文分词工具,如jieba分词库,将地址拆分为单词,便于后续处理。 3. **相似度计算...
1. 删除标点符号:`string.punctuation`包含了所有标点符号,可以结合正则表达式`re`库进行去除。 2. 转换为小写:`str.lower()`方法用于将文本转换为小写,消除大小写的差异。 3. 去除数字:使用正则表达式`re....