`

(转:) 谷歌正在解决敏感词的烦恼

 
阅读更多

(转自:) http://www.jz123.cn/text/0651528.html

 

 

  两年前的一个深夜,我独在网络上徘徊,遇见S君,前来问我道,“先生可曾知晓您的名字已经成为Google的敏感词?”我说“没有”。他就正告我,“先生去试一下吧,Google搜索引擎已经把您的名字屏蔽了。同时,L君和O君的名字也被屏蔽了。”

  看到这个消息,我暂时性地短路了。S君的头像又在一闪一闪的,点开来看:“先生干什么出格的事儿了吗?有啥需要帮忙的吗?”

  于是我大脑里立马闪现出《非诚勿扰》电影里葛优在教堂里忏悔的那个镜头,从小时候偷鸡烤来吃开始算起,到借看手相摸女同学小手,再到…………没有什么能上纲上线的大事啊,总体还算良民一枚啊。

  怎么回事呢?于是想到了万能的微博:

 

 

  微博果然万能,答案很快知晓。比如李开复的回复:“不是你,是你的姓。我也一样。”原来,是因为我姓“刘”了,而且有个官员也姓刘。好吧,姓刘的所有人名都不能在谷歌里被搜索了。

  这个时候,谷歌的敏感词词库在不断的壮大,对于用户来说,于是经常碰到“无法显示此网页”的错误提示。这还不算啥,更为糟糕的是,当出现这样的错误提示之后,在之后的几分钟内,你,就别想再使用Google搜索了。

  对于用户来说,一切都是未知的。于是,不知情的用户们把所有的愤怒都尽情的洒向了谷歌,痛斥着谷歌的不稳定,传播着谷歌的不可靠。

  消息源源不断的被反馈到了谷歌,他们坐不住了。

  据谷歌知识高级副总裁艾伦·尤斯塔斯(AlanEustace)昨天的文章透露,“经过长期严格的自我系统检视,我们未能找到任何问题。”这说明,全世界技术最NB的这家公司,发现这个问题不是他们造成的。“然而,在认真研究用户使用报告后,我们注意到这些连接中断与搜索某些特定字词有着密切关联。”

  于是,谷歌开始着手解决这些敏感词带来的烦恼。昨天,这个新玩意上线了,他们是这么解决的,比如搜索我的名字:

 

 

  用户搜索时,谷歌会给出一个提示:“请注意在中国大陆搜索[刘]很可能导致用户与谷歌的连接暂时被阻断。此阻断并不受谷歌控制。”

  如果我是外交部的官员,这个时候应该会特别愤怒,因为谷歌的提示明显山寨了他们的口气。不管如何,谷歌想通过这个提示撇清自己的责任。

  同时,谷歌会醒目的用黄色字体标出到底是哪个字词出现了问题,成为了敏感词。比如,图片中的“刘”字。

  用户如果要一意孤行,点击“仍然搜索”,那后果跟从前一样惨。如果想要结果,那就修改查询字词,比如换成汉语拼音“liuxingliang”。

  通过这个方法,谷歌想尽量减少由于敏感词而带来的搜索中断,从而给中国大陆的用户带来更好的搜索体验,同时,也尽量少的挨骂。

  作为一个中国大陆的用户,对谷歌的这种“不抛弃不放弃”的精神深深感动。但是,谷歌的这个新玩意也会带来另一个直接的后果,这个后果会让一个群体很难堪。是哪个群体呢,有些事不能说太细,试举一例:

 

 

  作为一个正常的用户,这个时候肯定会破口大骂:抄泥马,因为一个人就连“江苏”都不让搜索了?

  唉,谷歌啊谷歌,你这样做,把一切都大白于天下,让那个群体,情何以堪啊!


分享到:
评论

相关推荐

    sensitiveWordFiltering:多模式匹配 敏感词审核 支持谐音,特殊符号分割敏感词

    在IT行业中,敏感词过滤是一项重要的技术,尤其在社交媒体、论坛、评论系统等网络平台中,用于防止用户发布不适当或违规内容。标题中的"sensitiveWordFiltering"就是这样一个工具,它专注于敏感词的审核与过滤,具备...

    pyhon3.6 对输入敏感词识别

    在Python编程语言中,敏感词识别是一个常见的需求,特别是在文本处理、社交媒体监控或者网络内容过滤等领域。Python3.6版本提供了丰富的字符串操作和文件处理功能,使得实现敏感词识别变得非常方便。本教程将深入...

    laravel-snstvwd:laravel框架的敏感词过滤器

    敏感词过滤器 PHP基于确定有穷自动机(DFA)敏感词过滤器,支持 Laravel 框架。 安装 1. 利用composer安装包 $ composer require snstvwd/filter 2. 在config/app.php 里面添加: 'providers' => [ . . . ...

    敏感词管理及过滤

    在IT行业中,敏感词管理与过滤是一个至关重要的领域,尤其在大数据时代,信息安全与隐私保护愈发受到重视。本文将深入探讨MFC(Microsoft Foundation Classes)框架下如何实现敏感词的管理与过滤功能。 首先,MFC是...

    Python基于Scrapy的页面敏感词检测工具源码.zip

    Python基于Scrapy的页面敏感词检测工具是一种高效的数据抓取和处理框架,它结合了Scrapy库的强大功能,用于从网页中抓取信息并进行特定的敏感词检测。本工具适用于那些需要监控网络内容,避免违规信息发布的场景,如...

    sensy-words-filter:用于过滤出敏感词列表的软件包

    感性词 设置 $ npm install sensy-words-filter --save 用法 const { sensyWords } = require ( 'sensy-words-filter' ) // ES2015 modules import { sensyWords } from 'sensy-words-filter' 用星号替换黑名单中的...

    java敏感词检索工具

    Java敏感词检索工具是一种在社区问答、论坛等网络环境中用于过滤和检索可能涉及敏感内容的文本工具。在当今数字化时代,信息安全与言论管理变得尤为重要,此类工具能够帮助平台管理者及时发现并处理潜在的违规信息,...

    java敏感词过滤功能

    在Java开发中,实现敏感词过滤功能是一项常见的需求,特别是在社交媒体、论坛或评论系统中,以防止用户发布不当或违规内容。本项目的核心是通过Java编程实现敏感词的检测和替换,确保信息的安全和合规性。 `...

    Python简易敏感词屏蔽代码

    在IT行业中,尤其是在网络内容审查或信息安全领域,敏感词屏蔽是一项重要的技术。Python作为一种功能强大且易学的编程语言,常常被用来实现这样的功能。在这个名为"敏感词屏蔽.py"的文件中,我们可以预见到一个简单...

    java敏感词过滤

    在IT行业中,尤其是在社交网络、论坛或博客等平台的开发中,敏感词过滤是一项至关重要的功能。它主要用于防止用户发布包含不当、违法或有害信息的内容。本篇文章将深入探讨Java中实现敏感词过滤的技术和方法。 首先...

    利用Python正则表达式过滤敏感词的方法

    问题描述:很多网站会对用户发帖内容进行一定的检查,并自动把敏感词修改为特定的字符。 技术要点: 1)Python正则表达式模块re的sub()函数; 2)在正则表达式语法中,竖线“|”表示二选一或多选一。 参考代码: ...

    网站敏感词检测源码.rar

    本资源“网站敏感词检测源码.rar”提供了一种解决方案,包含了四种不同的算法,帮助开发者实现这一功能。接下来,我们将深入探讨这四种算法及其在实际应用中的价值。 1. **Aho-Corasick算法**:Aho-Corasick算法是...

    php实现敏感词过滤类

    - 禁词树:可以理解为一种优化的Trie树,除了存储敏感词外,还记录了敏感词出现的频率或其他相关信息,用于更高效地管理和过滤敏感词。 六、实际应用 这类敏感词过滤类广泛应用于社交媒体、论坛、博客评论等场景,...

    Android 敏感词过滤

    在Android开发中,敏感词过滤是一项重要的功能,尤其在处理用户输入、聊天内容或社区交互时,确保内容的合规性和安全性至关重要。本文将详细介绍如何在Android应用中实现敏感词过滤,以及如何使用提供的`TestFliter`...

    PHP 过滤敏感词 工具

    在IT行业中,尤其是在网站开发和社交媒体管理中,过滤敏感词是一项重要的任务,它涉及到内容审查、信息安全和用户体验。本文将详细探讨PHP实现敏感词过滤的工具及其相关知识点。 首先,我们要明白什么是敏感词。...

    JAVA 敏感词过滤

    在Java编程语言中,敏感词过滤是一项重要的任务,特别是在处理用户输入、社交媒体分析、文本审查等场景中。这个话题涉及到如何有效地检测并替换或者屏蔽文本中的特定词汇,以符合法律法规或者平台规定。以下是对...

    filter c++/QT敏感词过滤

    在IT行业中,尤其是在网络应用和社交媒体平台开发中,敏感词过滤是一项重要的技术。它主要用于防止用户发布或交流可能引起法律纠纷、违反社区规定或者不适宜的内容。本篇将深入探讨如何在C++与Qt框架下实现敏感词...

    网络敏感词过滤.rar

    本项目“网络敏感词过滤.rar”提供了一个自定义敏感词列表的解决方案,通过编程方式实现敏感词的屏蔽,确保网络内容的合规性。 首先,我们要了解什么是敏感词过滤。敏感词过滤是一种文本处理技术,主要应用于社交...

Global site tag (gtag.js) - Google Analytics