`
dcj3sjt126com
  • 浏览: 1897700 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

php 敏感词过滤高级版

    博客分类:
  • PHP
php 
阅读更多
前面介绍过一个过滤了些特殊字符的php程序,下面我们升级一下这个敏感词过滤函数更强大了有了它再也不怕敏感词中间加空格或者其他标点符号了。
 


只要用户可以发言的地方,就可能出现广告或者其他敏感词,因此必须加入敏感词过滤机制来保持站点的”纯洁”。

过滤机制:加入php关键字正则匹配

//$str 为用户数据
function wordFilter($str)
{
       /*
    获取敏感词列表
    敏感词的存储方法:
    1:存储在txt文件中(一般的方法)
    2:存储在缓存(比较好的方法)
    我是存储在memcachd中。
    */
    $words = getSensitiveWords();

    foreach ($words as $word)
    {
        $preg_letter = '/^[A-Za-z]+$/';
        if (preg_match($preg_letter, $str))
        {//匹配中文
        $str = strtolower($str);
        $pattern_1 = '/([^A-Za-z]+' . $word . '[^A-Za-z]+)|([^A-Za-z]+' . $word . '\s+)|(\s+' . $word . '[^A-Za-z]+)|(^' . $word . '[^A-Za-z]+)|([^A-Za-z]+' . $word.'$)/';
        //敏感词两边不为空
        if (preg_match($pattern_1, $str))
        {
            $flag = TRUE;
        }
        $pattern_2 = '/(^' . $word . '\s+)|(\s+' . $word . '\s+)|(\s+' . $word . '$)|(^' . $word . '$)/';
        //敏感词两边可以为空格
        if (preg_match($pattern_2, $str))
        {
            $flag = TRUE;
        }
        }
        else
        {//匹配英文字符串,大小写不敏感
        $pattern = '/\s*' . $word . '\s*/';
        if (preg_match($pattern, $str))
        {
            $flag = TRUE;
        }
        }
    }
}
存在问题:

如果单纯只加入关键字匹配,用户反过滤的方法五花八门,包括中间加入空格或者其他标点符号。
例子:
敏感词:扣扣

用户处理后:
扣 扣
扣,扣
扣@扣
扣1扣
这时候代码的正则匹配就可能匹配不出来。

解决办法:

先对用户数据去除所有的标点符号和一些特殊字符,然后再进行敏感词判断。

代码:

$flag_arr=array('?','!','¥','(',')',':','‘','’','“','”','《','》',',','…','。','、','nbsp','】','【','~');

        $content_filter=preg_replace('/\s/','',preg_replace("/[[:punct:]]/",'',strip_tags(html_entity_decode(str_replace($flag_arr,'',$content),ENT_QUOTES,'UTF-8'))));
$content_filter 就是处理后的用户数据,然后再进行 wordFilter($content_filter ) 过滤操作

分享到:
评论

相关推荐

    腾讯留言本(php)

    - **安全设置**:设置验证码、过滤敏感词,防止垃圾留言和恶意攻击。 - **用户管理**:管理注册用户,包括禁用、启用用户,以及查看用户信息。 - **更新维护**:定期检查并安装软件的更新,确保系统安全性和功能性。...

    PHPWind论坛 未知领域

    针对网络安全威胁,PHPWind内置了防灌水机制、IP封禁、敏感词过滤等功能,有效保护论坛免受恶意攻击和不良信息的侵扰。 5. **插件与API**: PHPWind提供了丰富的插件接口,允许开发者扩展论坛功能,如集成社交...

    HDWiki百科源码 v4.0.3GBK

    15、改进了评论中敏感词过滤功能,站长可在后台增加敏感词。 16、改进百科联盟插件。 17、修正了编辑器中上传PNG图片不能显示缩略图的错误。 18、修正了拥有删除词条权限的人,删除词条无提示的错误,防止用户不小心...

    史上最好传智播客就业班.net培训教程60G 不下会后悔

    功能点 站内搜索、栏目管理、视频播放(完全模仿优酷视频页面)、焦点图、静态页面生成(新浪、搜狐等大型网站普遍采用的技术)、文章管理、无刷新评论、评论的无刷新分页、敏感词过滤、用户管理、友情链接管理、...

    HDWiki百科源码 v4.0.3UTF8

    15、改进了评论中敏感词过滤功能,站长可在后台增加敏感词。 16、改进百科联盟插件。 17、修正了编辑器中上传PNG图片不能显示缩略图的错误。 18、修正了拥有删除词条权限的人,删除词条无提示的错误,防止用户不小心...

Global site tag (gtag.js) - Google Analytics