论坛首页 Java企业应用论坛

敏感字过滤设计问题

浏览 10528 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2004-03-17  
近段时间,国内几大blog提供商相继暂停服务。据说是内容违规的问题。
关于这方面,常见的解决办法就是对内容进行敏感字过滤。过滤规则直接影响到过滤的有效性。

我们曾经实现过的(最卡得死的)一种是,只要信息中存在敏感词中的单字,都卡掉。显然,这对正常使用造成很大影响,不足取。

发展为,在信息中的一定范围内出现敏感词的所有单字,则卡掉。

不知各位有没有其它的实现思路,分享一二?
   发表时间:2004-03-18  
我这招抛砖引玉果然不错

能否推荐一些资料? 我虽然搜索到一些,但似乎不太好.
0 请登录后投票
   发表时间:2004-03-20  
靠过虑手段并不能解决问题,有时也可用特殊字体替代敏感字词

我见过把图贴上去的,邮箱里也收到过,这就没法防了
0 请登录后投票
   发表时间:2004-03-22  
无明 写道
我见过把图贴上去的,邮箱里也收到过,这就没法防了


是啊,尤其是dlogcn(广告,广告, )贴图太方便了.如果真要发敏感信息,只要多做一点点功夫,我们就没办法了.

听说有一些搜索引擎可以搜索到图片的内容,包括字,但没有见识过.有经验的朋友介绍一下?
0 请登录后投票
   发表时间:2004-03-28  
好要图像识别啊!麻烦大了,万一在贴点类似注册时候生成那种带干扰的图片就凉了
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics