`
songzhan
  • 浏览: 250046 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

简单的过滤敏感词和String.replaceAll()的使用

 
阅读更多

 

public class SensitiveWords {
    public static void main(String[]  args){
        String[] a = {"周恩","毛泽"};
        String mingance = "很好啊,湖南毛泽很了不起";
        boolean f = true;
        for(int i =0; i<a.length;i++){
            if(mingance.contains(a[i])){
                System.out.println("包含有敏感词");
                f = false;
                break;
            }

        }
        System.out.println(f);

    }
}

 

 

以下原文章地址:http://www.blogjava.net/hill/archive/2009/04/29/268065.html

关键字: java replaceall 用法

Java代码 复制代码
  1. public class TryDotRegEx {   
  2. public static void main(String[] args) {   
  3. // TODO Auto-generated method stub   
  4. String str = "111.3.22.11";   
  5. str=str.replaceAll("(^|\\.)(\\d)(\\.|$)","$100$2$3");   
  6. str=str.replaceAll("(^|\\.)(\\d{2})(\\.|$)","$10$2$3");   
  7. str=str.replaceAll("(^|\\.)(\\d{2})(\\.|$)","$10$2$3");   
  8. str=str.replaceAll("(^|\\.)(\\d{1})(\\.|$)","$100$2$3");   
  9.            
  10. System.out.println(str);   
  11. }   
  12.   
  13. }  

打印结果:111,003,022,011;

正则表达式,关于String.replaceALL(..)
Java代码 复制代码
  1. class t1 {   
  2.        public static void main(String a[]) {   
  3.          String s = 'E:\jbx\x9\io9';   
  4.          String ss;   
  5. //把路径s中的'\'换为'\\',为何还要整8个'\'?我以为4个就行了。   
  6.          ss = s.replaceAll('\\\\', '\\\\\\\\')   
  7.          System.out.println('s= ' + s);   
  8.          System.out.println('ss=' + ss);   
  9. //output:     
  10. //s= E:\jbx\x9\io9   
  11. //ss=E:\\jbx\\x9\\io9   
  12.        }   
  13. }  

这里的关键是String.replaceAll()是用regular expression 来作为参数的。但是java本身的字符串对于转义符\也有类似的处理。首先,java会把“\\\\”解释成一个字符串(其中包含两个char)——“\ \”这个就是你在JDK的文档里看到的。
接下来,由于replaceAll是以正则表达式作为参数,所以“\\”被解释成一个regex。对于一个regex来说这就代表着一个字符,就是“\”。对后面的那个8个\来说,最终会被解释成“\\”。

换言之,假设String.replaceAll()是以普通字符串,而不是regex作为参数,那么这样写代码: String target = source.replaceAll('\\', '\\\\'); 就可以了。

===============================
在replaceAll(String,String)方法中需要特殊处理英文状态的括号,在网上找了一下,可以使用下面的写法将英文括号替换成其他字符(比如中文全角括号):str1.replaceAll("\\(","(");

Java String replaceAll and regex
在java中要将一个字符串的中$符号去除。我是这样写的:
String tmp = "-$125402.00";
tmp.replaceAll("$","");
可是执行去来的结果并没有把$去除。后来找资料才发现要这样写
tmp.replaceAll("\\$","")才可以。
String replaceAll(String regex, String replacement)中的两个参数都是regex。尤其是当第二个参数replacement是用户输入或指定的字符串时,如果其中包含regex特 殊字符(主要是\和$)而不加注意,就容易导致问题引发异常。这种情况下如果只是简单的字符串替换而无需regex引擎参与的话,就不要用 replaceAll好了。JDK1.5中加入了String replace(CharSequence target, CharSequence replacement),可以用它。JDK1.4或以下,自己搞一个好了,如 oldReplace:http://www.javapractices.com/Topic80.cjp
    
我在写程序的时候,需要将"\"字符写入一个文本文件,开始以为这不是个什么问题,转换一下就好了嘛,代码如下:

targetPath = targetPath.replaceAll("\\", "\\\\");
fileOperate.createFile(fileName, targetPath);


原以为没有问题,这样就可以先在读入的字符串中把"\"转换为"\\",然后在写入文本文件时就会写成"\",没想到,报如下错误:

java.util.regex.PatternSyntaxException: Unexpected internal error near index 1
\

回来查了资料才发现,java的replaceAll函数,使用的是正则表达式作为转换依据,而"\"在正则表达式中也是特殊字符,最后,写成下面的代码才达到了我预想的目的:

targetPath = targetPath.replaceAll("\\\\", "\\\\\\\\");
fileOperate.createFile(fileName, targetPath);



=====================================

replace和replaceAll方法的区别:

主要就是后者是基于规则表达多的替换,而前者是一般的基于字符或字符序列本身的替换。

比如,可以通过replaceAll("\\d", "*")把一个字符串所有的数字字符都换成星号,replace就做不到,因为它不是基于规则表达多的替换。

 

 

分享到:
评论

相关推荐

    网站敏感词检测源码.rar

    在敏感词检测中,这种算法能够快速定位并过滤掉敏感词汇,提高处理效率。 2. **BF(Brute Force)暴力匹配算法**:这是一种基础的字符串匹配算法,通过逐字符比较来判断目标字符串是否包含敏感词。虽然BF算法简单易懂...

    敏感词过滤系统.zip

    本文将深入探讨一个基于C语言实现的简单敏感词过滤系统,该系统包含了服务端和客户端的代码实现,非常适合初学者理解和学习。 首先,我们要明白敏感词过滤系统的功能。它主要用于检测和阻止含有特定敏感词汇的文本...

    php实现敏感词过滤类.zip

    PHP实现的敏感词过滤类通常会利用数据结构如字典树(Trie树)来高效地进行匹配和过滤。 在这个"php实现敏感词过滤类.zip"压缩包中,我们有一个PHP类,用于处理敏感词过滤任务。这个类可能会包含以下核心功能: 1. ...

    行业分类-设备装置-一种面向文本信息的敏感词过滤方法.zip

    标签“行业分类-设备装置”暗示这可能是某种硬件设备或系统中的软件组件,该组件专门用于识别和过滤特定行业的敏感词汇。在实际应用中,这样的设备可能被用于企业内部的信息安全管理,或者是公共服务领域的信息审查...

    一种面向网络安全的图像文字敏感词过滤方法.pdf

    该方法首先使用深度学习算法来对图像中的文字进行检测,然后使用自然语言处理技术来对检测出的文字进行敏感词检测和过滤。实验结果表明,该方法能够有效地检测和过滤图像中的敏感词。 此外,本文还讨论了图像文字...

    基于Vue+SpringBoot开发前后端分离的个人博客系统源码+sql数据库+项目说明(带敏感词过滤).zip

    基于Vue+SpringBoot开发前后端分离的个人博客系统源码+sql数据库+项目说明(带敏感词过滤).zip # 主要技术: 前端 : 核心框架:Vue 数据请求和响应:Axios 富文本编辑器:mavon-editor 后端 : 核心框架:...

    行业分类-设备装置-敏感词编辑器.zip

    行业分类-设备装置-敏感词编辑器.zip

    基于springboot实现的博客系统源码(具备评论、留言、简历编写下载、敏感词过滤等功能).zip

    1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,...

    php扩展过滤敏感词

    php扩展:trie_filter 过滤敏感词。1.生成敏感词文件,2.加载使用敏感词库,3.查找敏感词。可以循环查找替换,最后输出替换后的文本

    网络敏感词过滤.rar

    同时,随着人工智能的发展,结合机器学习的方法,敏感词过滤系统能够自我学习和更新,提高过滤的准确性和适应性。 总的来说,"网络敏感词过滤.rar"提供的工具和方法对于网络内容管理者来说是极其有价值的,它可以...

    用MATLAB实现维吾尔语广播新闻敏感词检索系统.pdf

    用MATLAB实现维吾尔语广播新闻敏感词检索系统.pdf

    敏感词过滤.zip

    虽然敏感词过滤能有效阻止不良信息,但也会存在误判和漏判的问题。误判可能导致正常信息被错误拦截,而漏判则可能让敏感信息漏网。因此,系统需要具备一定的自学习和优化能力,通过机器学习算法持续改进过滤规则。 ...

    (基于datrie库的GO敏感词过滤).zip

    简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译...

    PHP敏感词过滤系统.zip

    软件开发设计:应用软件开发、系统...云计算与大数据:包括云计算平台、大数据分析、人工智能、机器学习等,云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。

    敏感词分析报告.docx

    ### 敏感词分析报告知识点解析 ...通过上述解析,我们可以了解到该项目旨在通过Java编程语言实现一个简单而实用的敏感词分析系统,不仅有助于提升学生的编程技能,还能加深他们对软件工程流程的理解。

    JAVA 敏感词过滤

    2. SensitiveWordFilter:一个简单的Java敏感词过滤库,提供了多种过滤策略。 3. SnowNLP:虽然主要用于中文文本处理,但也可用于敏感词过滤。 在实际开发中,应结合具体需求选择合适的过滤方法,并考虑性能、准确...

    使用python开发的极简的敏感词过滤系统.zip

    Python使用技巧,实战应用...详细介绍了一些Python框架的各种功能和模块,以及如何使用Python进行GUI开发、网络编程和跨平台应用开发等。 适用于初学者和有经验的开发者,能够帮助你快速上手JPython并掌握其高级特性。

    使用go语言编写的基于DFA算法的敏感词过滤器.zip

    简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译...

    java敏感词过滤功能

    通常,敏感词过滤器会使用字典树(如Trie树)或者关键词列表来存储敏感词,并提供方法来判断一个字符串是否包含敏感词,或者将敏感词替换为星号等其他字符。 `List.java`:这个文件可能是用于存储敏感词列表的数据...

Global site tag (gtag.js) - Google Analytics