`
dcj3sjt126com
  • 浏览: 1871203 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

php 敏感词过滤高级版

    博客分类:
  • PHP
php 
阅读更多
前面介绍过一个过滤了些特殊字符的php程序,下面我们升级一下这个敏感词过滤函数更强大了有了它再也不怕敏感词中间加空格或者其他标点符号了。
 


只要用户可以发言的地方,就可能出现广告或者其他敏感词,因此必须加入敏感词过滤机制来保持站点的”纯洁”。

过滤机制:加入php关键字正则匹配

//$str 为用户数据
function wordFilter($str)
{
       /*
    获取敏感词列表
    敏感词的存储方法:
    1:存储在txt文件中(一般的方法)
    2:存储在缓存(比较好的方法)
    我是存储在memcachd中。
    */
    $words = getSensitiveWords();

    foreach ($words as $word)
    {
        $preg_letter = '/^[A-Za-z]+$/';
        if (preg_match($preg_letter, $str))
        {//匹配中文
        $str = strtolower($str);
        $pattern_1 = '/([^A-Za-z]+' . $word . '[^A-Za-z]+)|([^A-Za-z]+' . $word . '\s+)|(\s+' . $word . '[^A-Za-z]+)|(^' . $word . '[^A-Za-z]+)|([^A-Za-z]+' . $word.'$)/';
        //敏感词两边不为空
        if (preg_match($pattern_1, $str))
        {
            $flag = TRUE;
        }
        $pattern_2 = '/(^' . $word . '\s+)|(\s+' . $word . '\s+)|(\s+' . $word . '$)|(^' . $word . '$)/';
        //敏感词两边可以为空格
        if (preg_match($pattern_2, $str))
        {
            $flag = TRUE;
        }
        }
        else
        {//匹配英文字符串,大小写不敏感
        $pattern = '/\s*' . $word . '\s*/';
        if (preg_match($pattern, $str))
        {
            $flag = TRUE;
        }
        }
    }
}
存在问题:

如果单纯只加入关键字匹配,用户反过滤的方法五花八门,包括中间加入空格或者其他标点符号。
例子:
敏感词:扣扣

用户处理后:
扣 扣
扣,扣
扣@扣
扣1扣
这时候代码的正则匹配就可能匹配不出来。

解决办法:

先对用户数据去除所有的标点符号和一些特殊字符,然后再进行敏感词判断。

代码:

$flag_arr=array('?','!','¥','(',')',':','‘','’','“','”','《','》',',','…','。','、','nbsp','】','【','~');

        $content_filter=preg_replace('/\s/','',preg_replace("/[[:punct:]]/",'',strip_tags(html_entity_decode(str_replace($flag_arr,'',$content),ENT_QUOTES,'UTF-8'))));
$content_filter 就是处理后的用户数据,然后再进行 wordFilter($content_filter ) 过滤操作

分享到:
评论

相关推荐

    thinkphp5敏感词过滤类

    具体到提供的压缩包文件,名为"DfaFilter"的文件可能是一个PHP类或者脚本,实现了DFA敏感词过滤的功能。在实际项目中,开发者需要将其引入到ThinkPHP5框架的项目中,通常是通过Composer来管理依赖。引入后,可以按照...

    php敏感词过滤案例

    php敏感词过滤案例,很简单很实用,现在网站好多关键词都是国家禁止的词,收集网络许多资料都不太好,为天下网自己写了一个,

    敏感词过滤器(富含3000词汇)

    `note_check.php`可能是用来检测输入文本中是否存在敏感词的函数或类,而`note_content.php`则可能包含处理文本内容、过滤敏感词的具体逻辑。 `filterwords.txt`文件则包含了敏感词列表,这是一个纯文本文件,通常...

    php做的敏感词过滤,功能很强大喔!神马敏感词都得过滤掉

    本文将深入探讨如何使用PHP实现敏感词过滤功能,以及其在维护网络环境和谐、避免不当言论传播中的作用。 首先,PHP是一种广泛使用的服务器端脚本语言,尤其在网页开发中占据重要地位。它的灵活性和强大的字符串处理...

    php实现敏感词过滤类

    综上所述,创建一个PHP敏感词过滤类涉及的主要知识点包括Trie树数据结构、字符串遍历算法、类设计与实现,以及在实际应用场景中的策略调整。通过这些技术,我们可以有效地过滤和管理敏感词汇,提高系统安全性。

    php 敏感词过滤 源码下载

    PHP扩展,专门用于敏感词检测。速度快,能返回敏感词的偏移量和内存空间。只支持linux系统,PHP5.2测试通过。但是需要注意字符集。详细使用过程可参考:...

    基于PHP的DFA算法敏感词过滤器

    本文将深入探讨基于PHP的DFA算法敏感词过滤器,它是如何工作的,以及如何与Laravel框架集成。 **DFA(Deterministic Finite Automaton)确定有限状态自动机**是一种计算模型,常用于文本处理和模式匹配。DFA的核心...

    PHP实现的敏感词过滤方法示例

    本篇文章主要讲述了如何利用PHP编程语言实现敏感词过滤的方法。敏感词过滤是网络内容监管中一个非常重要的环节,尤其在网络社区、论坛、聊天室等平台上,对于维护网络环境健康、预防不良信息传播具有重要作用。 ...

    6K+网站敏感词数据集(php tree数据结构 高效敏感词过滤)

    php通过tree数据结构,实现根据大量敏感词数据集过滤字符串中敏感词; 包括一份6K+的敏感词数据表哦(mysql直接导入)

    PHP 过滤敏感词 工具

    在IT行业中,尤其是在网站开发和社交媒体管理中...通过以上技术,我们可以构建一个强大的PHP敏感词过滤工具,确保网络内容的安全性和合规性。在实际应用中,还需要根据具体需求和场景进行调整和优化,以达到最佳效果。

    codeigniter 辅助函数 - 敏感词过滤

    总之,CodeIgniter的辅助函数为敏感词过滤提供了便利,通过自定义的`filter_helper.php`,我们可以构建适合自己项目需求的过滤机制。然而,随着需求的复杂性增加,可能需要结合其他数据结构和算法来提高过滤的准确性...

    [示例][PHP]敏感词过滤的php类库.zip

    本类库的敏感词替换算法,效率比str_replace高4倍(附6仟个敏感词),这个类库是没有学习过Trie树的时候写的,之后我接触了AC算法,我的算法和AC是类似的结构和逻辑,都是利用树,空间换时间,对搜索/替换海量数据...

    敏感词过滤的php类库.zip

     }本类库的敏感词替换算法,效率比str_replace高4倍(附6仟个敏感词),这个类库是没有学习过Trie树的时候写的,之后我接触了AC算法,我的算法和AC是类似的结构和逻辑,都是利用树,空间换时间,对搜索/替换海量...

    php简单过滤敏感词

    本教程将详细介绍如何在PHP中实现简单的敏感词过滤功能,以满足像论坛发帖这样的场景需求。 首先,我们要理解什么是敏感词过滤。敏感词过滤是指在用户输入的数据(如论坛帖子、评论等)中查找并替换或删除预定义的...

    PHP敏感词过滤系统.zip

    软件开发设计:应用软件开发、系统软件开发、移动应用开发、网站开发Node.js、C++、Java、python、web、C#等语言的项目开发与学习资料 硬件与设备:单片机、EDA、proteus、RTOS、包括计算机硬件、服务器、网络设备、...

    用于检测敏感词的 PHP 扩展

    总的来说,这个PHP敏感词过滤扩展利用字典树优化了敏感词检测的效率,修复后的版本提升了其稳定性和准确性,为开发者提供了一种实用的工具,以保障网站内容的健康和安全。在实际应用中,根据具体的需求,你可能还...

    php扩展过滤敏感词

    php扩展:trie_filter 过滤敏感词。1.生成敏感词文件,2.加载使用敏感词库,3.查找敏感词。可以循环查找替换,最后输出替换后的文本

    laravel-snstvwd:laravel框架的敏感词过滤器

    PHP基于确定有穷自动机(DFA)敏感词过滤器,支持 Laravel 框架。 安装 1. 利用composer安装包 $ composer require snstvwd/filter 2. 在config/app.php 里面添加: 'providers' => [ . . . Snstvwd\Filter\...

    过滤敏感词汇的laravel包使用DFA算法

    3. 过滤器接口:提供一个方便的接口,让开发者可以轻松地在路由、控制器、视图等不同位置调用敏感词过滤功能。 4. 配置文件:允许用户自定义敏感词库的位置、DFA的性能设置等。 5. 文档和示例:指导用户如何安装、...

Global site tag (gtag.js) - Google Analytics