`
joan0106
  • 浏览: 141718 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

Java中过滤敏感词

 
阅读更多

在发表评论,文章时常常需要过滤一些敏感词...

把自己的拿出来晒晒

1.写个过滤的类:

import java.io.IOException;
import java.io.InputStream;
import java.util.Enumeration;
import java.util.Properties;
import java.util.regex.Pattern;
import java.util.regex.Matcher;

public class KeyWordFilter {

		private static Pattern pattern = null;
		
		public static void initPattern(){
			StringBuffer patternBuf = new StringBuffer("");
			try{
				InputStream in = KeyWordFilter.class.getClassLoader().getResourceAsStream("word.properties");
				Properties pro = new Properties();
				pro.load(in);
				Enumeration enu = pro.propertyNames(); 
				while(enu.hasMoreElements()){
					patternBuf.append((String)enu.nextElement()+"|");
				}
				patternBuf.deleteCharAt(patternBuf.length()-1);
				pattern = Pattern.compile(new String(patternBuf.toString().getBytes("ISO-8859-1"), "UTF-8"),Pattern.CASE_INSENSITIVE); //编译一个正则表达式,同时生成Pattern
			}catch(IOException ioEx){
				ioEx.printStackTrace();
			}
		}
		public static String doFilter(String str){
			try {
				Matcher m = pattern.matcher(str); //匹配到得用去掉
				str = m.replaceAll("*");
			}catch (Exception e){
				e.printStackTrace();
			}
			return str;
		}
}

 2.在控制层进行操作,即action类中,在需要的方法中进行调用

 KeyWordFilter.initPattern();
	    String newContent=KeyWordFilter.doFilter(content);

 其中content就是显示层传递的参数(需要过滤的)

分享到:
评论
29 楼 cclsw07 2011-01-28  
悲催的lz,欢乐的回帖~~
28 楼 kingwood2005 2011-01-28  
xuby 写道
程序员也要有点道德吧?
不能用技术干缺德事。
即时迫于生计干了,也不至于这么出来显摆吧?
你想很多年后,你子孙知道了你干的这些事,会怎么看你?


不要说的那么严重
27 楼 adaikiss 2011-01-28  
人工过滤最好用了... 什么回形体, S形体, 金字塔体, 你软件过滤个看看
26 楼 liusong1111 2011-01-28  
请参考《使用DFA实现文字过滤》:
http://www.iteye.com/topic/336577

本贴投了隐藏。
25 楼 yangfuchao418 2011-01-28  
呵呵 这样做不太好,参考 搜索引擎中的分词技术实现好多了
24 楼 J-catTeam 2011-01-28  
需要敏感词库
23 楼 zhujinguo 2011-01-28  
我试了下,没用
22 楼 xuby 2011-01-28  
程序员也要有点道德吧?
不能用技术干缺德事。
即时迫于生计干了,也不至于这么出来显摆吧?
你想很多年后,你子孙知道了你干的这些事,会怎么看你?
21 楼 udvs 2011-01-28  
确实是正则入门简例
20 楼 qiii2006 2011-01-28  
Unmi 写道
可悲的应用


+1
19 楼 Unmi 2011-01-28  
可悲的应用
18 楼 jone33 2011-01-28  
你这样加载属性文件,如果过滤库很大 你怎么解决性能?
17 楼 xxxx3848484 2011-01-28  
各位别光顾着喷啊 说说实在的过滤系统 是怎么弄的
16 楼 linliangyi2007 2011-01-28  
楼主这个也叫过滤系统?!!!

贻笑大方了~~ 不如说正则式入门好啵!
15 楼 同步卫星 2011-01-28  
没感觉到有什么作用。
14 楼 kxys422834 2011-01-28  
其实在过滤也没用,广大的群众是有解决办法的。yy---------->y   .   y
13 楼 courage207 2011-01-27  
http://www.syljy.com/
12 楼 soooxp 2011-01-27  
弄个小工具,固定列数文字竖排,看你能不能过滤
11 楼 ivyshark 2011-01-27  
我 敏
  就  感
    是   词

  
这样的可以吗? lz?
10 楼 lkj107 2011-01-27  
现在**功的邮件都是图片了,你怎么过滤啊

相关推荐

    java敏感词过滤功能

    在Java开发中,实现敏感词过滤功能是一项常见的需求,特别是在社交媒体、论坛或评论系统中,以防止用户发布不当或违规内容。本项目的核心是通过Java编程实现敏感词的检测和替换,确保信息的安全和合规性。 `...

    java实现敏感词过滤

    在Java中实现敏感词过滤,我们可以采用以下几种方法: 1. **字符串匹配**:最基础的方法是使用字符串的contains()方法,逐个比较敏感词。但这种方法效率较低,不适合大量敏感词的场景。 2. **正则表达式**:将敏感...

    java利用DFA算法实现敏感词过滤功能

    在本文中,我们将探讨如何使用DFA(有穷自动机)算法在Java中实现敏感词过滤功能。敏感词过滤在许多应用程序中都是必要的,例如社交媒体、论坛或博客平台,以防止用户发布不当或有害的内容。以下是对DFA算法及其在...

    高效敏感词过滤JAVA实现(DFA算法) 5000字2ms

    高效敏感词过滤JAVA实现(DFA算法) 5000字2ms 节点 + 2进制标识(节省空间/提高查询效率) 附源码、注释,附带专业敏感词库(3396个敏感词) 看得上就拿去用,替换下一两处util方法、改个路径即可 不求什么,...

    java敏感词过滤

    本篇文章将深入探讨Java中实现敏感词过滤的技术和方法。 首先,敏感词过滤的核心在于如何有效地匹配和替换敏感词汇。Java提供了一些强大的字符串处理和正则表达式功能,可以用来实现这一目标。正则表达式是匹配文本...

    java敏感词过滤(支持指定字段过滤)

    在Java开发中,敏感词过滤是一项重要的功能,尤其在处理用户输入、评论或者社交媒体内容时,需要确保不包含任何可能引发争议或不适当的内容。本项目适用于基于SSM(Spring、SpringMVC、MyBatis)和SpringBoot框架的...

    java。dfa算法实现敏感词过滤

    在IT行业中,尤其是在文本处理和数据安全领域,敏感词过滤是一项重要的技术。它主要用于屏蔽或替换网络中的不当、非法或敏感词汇,确保信息的合规性和安全性。本篇将重点介绍如何使用Java实现基于DFA(Deterministic...

    java 敏感词过滤 并显示内容所包含的敏感词

    本篇将详细探讨如何在Java中进行敏感词过滤,并展示如何显示内容中包含的敏感词。 首先,我们要理解敏感词过滤的核心原理。敏感词过滤通常基于字典匹配法,即预先建立一个敏感词库,然后通过遍历输入文本与词库中的...

    JAVA 敏感词过滤

    在Java编程语言中,敏感词过滤是一项重要的任务,特别是在处理用户输入、社交媒体分析、文本审查等场景中。这个话题涉及到如何有效地检测并替换或者屏蔽文本中的特定词汇,以符合法律法规或者平台规定。以下是对...

    java中DFA算法过滤敏感词

    DFA全称为:Deterministic Finite Automaton,即确定有穷自动机。其特征为:有一个有限状态集合和一些从一个状态通向另一个状态的...但不同于不确定的有限自动机,DFA中不会有从同一状态出发的两条边标志有相同的符号。

    JAVA过滤敏感词

    这个"JAVA过滤敏感词"项目提供了一个自我实现的解决方案,帮助开发者实现在文本中检测并替换或移除敏感词汇。下面我们将深入探讨这个话题。 首先,我们需要了解什么是敏感词过滤。敏感词过滤是指在文本数据处理中,...

    Java语言实现的敏感词过滤器

    我们在开发系统或者应用的过程中,经常需要对用户提交的评论或者文章进行审核,对其中的敏感词进行校验或者过滤,本资源可以帮助各位小伙伴以一个简单的方式实现敏感词的过滤,代码精简易懂,可以应用在实际开发过程中

    java敏感词检索工具

    Java敏感词检索工具是一种在社区问答、论坛等网络环境中用于过滤和检索可能涉及敏感内容的文本工具。在当今数字化时代,信息安全与言论管理变得尤为重要,此类工具能够帮助平台管理者及时发现并处理潜在的违规信息,...

    一种基于Java Web的敏感词过滤方法研究与实现.pdf

    从提供的文件内容来看,本文是一篇关于Java Web技术研究的文章,主要介绍了一种基于Java Web的敏感词过滤系统的实现方法。该系统通过自动识别和阻断含有敏感词的聊天内容,并将敏感词替换为特定的符号或关键词,以...

    基于Java语言的敏感词过滤服务设计源码

    该项目是一款基于Java语言的敏感词过滤服务设计源码,包含22个文件,主要由16个Java源文件、2个Markdown文档、1个Git忽略规则文件、1个开源协议文件、1个XML配置文件、1个YAML配置文件组成。该服务旨在提供高效的...

    Java敏感词过滤Java敏感词过滤

    ### Java敏感词过滤技术解析 #### 一、概述 在互联网时代,为了维护网络环境的健康与安全,很多平台都需要对用户输入的信息进行敏感词过滤处理。敏感词过滤技术主要应用于论坛、博客、社交媒体等场景,用以检测并...

    java做敏感词监测

    在Java编程语言中,敏感词监测是一项重要的功能,特别是在处理用户输入、社交媒体分析、内容过滤等场景中。这个压缩包文件可能包含了一套后端实现敏感词检测的解决方案。下面我们将详细探讨Java如何进行敏感词监测,...

    java过滤敏感词

    以下是一些关于“Java过滤敏感词”的核心知识点: 1. **字符串处理**:在Java中,我们经常使用`String`类来处理文本。`String`类提供了丰富的API,如`indexOf()`、`replace()`和`replaceAll()`,可以用来查找和替换...

    java 敏感词过滤

    在Java编程环境中,敏感词过滤是一项重要的任务,特别是在处理用户输入、社交媒体监控或者内容审查时。这个主题主要涉及如何在文本中检测并移除或替换指定的敏感词汇,以确保内容的安全性和合规性。以下是对这个知识...

Global site tag (gtag.js) - Google Analytics