- 浏览: 444110 次
- 性别:
- 来自: 深圳
文章分类
- 全部博客 (158)
- J2SE (15)
- c/c++ (17)
- linux & ubuntu (20)
- js (18)
- algorithm (21)
- android (1)
- software (3)
- svn (1)
- db (6)
- other (19)
- css (5)
- go (1)
- html 5 (3)
- computer science (1)
- php (3)
- 创业 (8)
- EJB & jboss (1)
- TDD (1)
- jsp & servlet (2)
- http, tcp & ip (2)
- hibernate (1)
- json (1)
- 乐 (2)
- ps (2)
- netbeans (1)
- extjs (2)
- eclipse (4)
- 项目管理 (1)
- varnish (2)
- study abroad (1)
- python (1)
- erlang (1)
- math (1)
- shell (1)
- assembly (4)
- lucene (1)
- web (1)
- http (1)
- tcp & ip (1)
最新评论
-
yiguxianyun:
...
css li 不换行 -
stdayong:
...
netbeans 中使用 maven -
程序猿_星:
为啥会中文乱码啊
servlet 以 gzip 格式返回数据 -
huanhuan519:
感谢分享~
gdb 调试工具 -
heyl1234:
写过些js,对css还不熟。谢谢~
css li 不换行
(转自:) http://www.jz123.cn/text/0651528.html
两年前的一个深夜,我独在网络上徘徊,遇见S君,前来问我道,“先生可曾知晓您的名字已经成为Google的敏感词?”我说“没有”。他就正告我,“先生去试一下吧,Google搜索引擎已经把您的名字屏蔽了。同时,L君和O君的名字也被屏蔽了。”
看到这个消息,我暂时性地短路了。S君的头像又在一闪一闪的,点开来看:“先生干什么出格的事儿了吗?有啥需要帮忙的吗?”
于是我大脑里立马闪现出《非诚勿扰》电影里葛优在教堂里忏悔的那个镜头,从小时候偷鸡烤来吃开始算起,到借看手相摸女同学小手,再到…………没有什么能上纲上线的大事啊,总体还算良民一枚啊。
怎么回事呢?于是想到了万能的微博:
微博果然万能,答案很快知晓。比如李开复的回复:“不是你,是你的姓。我也一样。”原来,是因为我姓“刘”了,而且有个官员也姓刘。好吧,姓刘的所有人名都不能在谷歌里被搜索了。
这个时候,谷歌的敏感词词库在不断的壮大,对于用户来说,于是经常碰到“无法显示此网页”的错误提示。这还不算啥,更为糟糕的是,当出现这样的错误提示之后,在之后的几分钟内,你,就别想再使用Google搜索了。
对于用户来说,一切都是未知的。于是,不知情的用户们把所有的愤怒都尽情的洒向了谷歌,痛斥着谷歌的不稳定,传播着谷歌的不可靠。
消息源源不断的被反馈到了谷歌,他们坐不住了。
据谷歌知识高级副总裁艾伦·尤斯塔斯(AlanEustace)昨天的文章透露,“经过长期严格的自我系统检视,我们未能找到任何问题。”这说明,全世界技术最NB的这家公司,发现这个问题不是他们造成的。“然而,在认真研究用户使用报告后,我们注意到这些连接中断与搜索某些特定字词有着密切关联。”
于是,谷歌开始着手解决这些敏感词带来的烦恼。昨天,这个新玩意上线了,他们是这么解决的,比如搜索我的名字:
用户搜索时,谷歌会给出一个提示:“请注意在中国大陆搜索[刘]很可能导致用户与谷歌的连接暂时被阻断。此阻断并不受谷歌控制。”
如果我是外交部的官员,这个时候应该会特别愤怒,因为谷歌的提示明显山寨了他们的口气。不管如何,谷歌想通过这个提示撇清自己的责任。
同时,谷歌会醒目的用黄色字体标出到底是哪个字词出现了问题,成为了敏感词。比如,图片中的“刘”字。
用户如果要一意孤行,点击“仍然搜索”,那后果跟从前一样惨。如果想要结果,那就修改查询字词,比如换成汉语拼音“liuxingliang”。
通过这个方法,谷歌想尽量减少由于敏感词而带来的搜索中断,从而给中国大陆的用户带来更好的搜索体验,同时,也尽量少的挨骂。
作为一个中国大陆的用户,对谷歌的这种“不抛弃不放弃”的精神深深感动。但是,谷歌的这个新玩意也会带来另一个直接的后果,这个后果会让一个群体很难堪。是哪个群体呢,有些事不能说太细,试举一例:
作为一个正常的用户,这个时候肯定会破口大骂:抄泥马,因为一个人就连“江苏”都不让搜索了?
唉,谷歌啊谷歌,你这样做,把一切都大白于天下,让那个群体,情何以堪啊!
发表评论
-
我们的未来在哪里
2012-11-14 11:53 14毕业已经4年多了, 刚毕业时拿着行李什么都不想就跑到了 ... -
(转) GAE+WallProxy-plugins 翻 墙
2012-08-15 03:24 8用 GAE+WallProxy-plugins, 翻 墙, ... -
日本 女足 我支持你!!!
2012-08-10 04:48 926虽然日本女足只拿了银牌, 但是你们比美国队强多了, 我支持你们 ... -
视频网站 广告 屏蔽 - 彻底版
2012-07-07 14:06 2905参考: http://joys.name/2011/09/bl ... -
(from cnn) Google warns users of state-sponsored hacking
2012-06-08 00:15 1117(this new is from CNN: http: ... -
火车票 网上订票 经验
2012-01-08 12:17 2690火车票 网上订票 经验 (以下经验是 2012年 ... -
言论没自由
2011-06-04 11:44 1微博管理员:尊敬的用户,您在2011-05-23 ... -
近来的感想
2011-04-07 20:10 1141想了很多,也许对这个社会看得太清楚,很失望,这就是命运吗? ... -
ways to abroad
2011-04-05 12:59 1090转载自: www.xxx.com 1.旅游签证 需要 ... -
gmail 无法登录 原因&解决
2011-04-03 18:25 9930gmail 无法登录现象: gmail 最近 一会能 ... -
你幸福吗?
2011-03-30 07:22 1040(今天醒得很早,就随便翻翻) 幸福度调查: 世界各国 ... -
字符集 & 编码
2011-01-31 01:18 1978转载自: http://webcenter.hit.edu.c ... -
深夜了
2010-10-29 01:01 1039深夜了,我在想你,你在想谁? 为啥咱俩没有缘分呢!!!!!! ... -
技术学习 的 几方面
2010-08-13 00:03 1131技术学习 的 几方面 理论 ... -
欧美 经典电影
2010-08-10 23:21 1508欧美经典电影: 1:罗马假日--奥黛丽.赫本 2:魂断 ... -
祭奠下今天
2010-04-28 23:32 1068祭奠下今天 抓紧前行的路,这里只是歇脚地,不属于我,寻找自己 ... -
地震 级别&能量
2010-04-19 09:44 2126地震级别通常分为 1-12 级,用 M 表示, 地震所释放的能 ... -
丑陋的中国当代大学生
2010-04-02 13:55 1362丑陋的中国当代大学生 ... -
google web search 访问
2010-03-30 18:01 373google web search 访问不了了! 虽然 go ... -
21世纪 四大名著
2010-03-23 14:36 118321世纪四大名著 《渔民政策》,《地王术》,《河蟹》,《四面 ...
相关推荐
在IT行业中,敏感词过滤是一项重要的技术,尤其在社交媒体、论坛、评论系统等网络平台中,用于防止用户发布不适当或违规内容。标题中的"sensitiveWordFiltering"就是这样一个工具,它专注于敏感词的审核与过滤,具备...
在Python编程语言中,敏感词识别是一个常见的需求,特别是在文本处理、社交媒体监控或者网络内容过滤等领域。Python3.6版本提供了丰富的字符串操作和文件处理功能,使得实现敏感词识别变得非常方便。本教程将深入...
敏感词过滤器 PHP基于确定有穷自动机(DFA)敏感词过滤器,支持 Laravel 框架。 安装 1. 利用composer安装包 $ composer require snstvwd/filter 2. 在config/app.php 里面添加: 'providers' => [ . . . ...
在IT行业中,敏感词管理与过滤是一个至关重要的领域,尤其在大数据时代,信息安全与隐私保护愈发受到重视。本文将深入探讨MFC(Microsoft Foundation Classes)框架下如何实现敏感词的管理与过滤功能。 首先,MFC是...
Python基于Scrapy的页面敏感词检测工具是一种高效的数据抓取和处理框架,它结合了Scrapy库的强大功能,用于从网页中抓取信息并进行特定的敏感词检测。本工具适用于那些需要监控网络内容,避免违规信息发布的场景,如...
感性词 设置 $ npm install sensy-words-filter --save 用法 const { sensyWords } = require ( 'sensy-words-filter' ) // ES2015 modules import { sensyWords } from 'sensy-words-filter' 用星号替换黑名单中的...
Java敏感词检索工具是一种在社区问答、论坛等网络环境中用于过滤和检索可能涉及敏感内容的文本工具。在当今数字化时代,信息安全与言论管理变得尤为重要,此类工具能够帮助平台管理者及时发现并处理潜在的违规信息,...
在Java开发中,实现敏感词过滤功能是一项常见的需求,特别是在社交媒体、论坛或评论系统中,以防止用户发布不当或违规内容。本项目的核心是通过Java编程实现敏感词的检测和替换,确保信息的安全和合规性。 `...
在IT行业中,尤其是在网络内容审查或信息安全领域,敏感词屏蔽是一项重要的技术。Python作为一种功能强大且易学的编程语言,常常被用来实现这样的功能。在这个名为"敏感词屏蔽.py"的文件中,我们可以预见到一个简单...
在IT行业中,尤其是在社交网络、论坛或博客等平台的开发中,敏感词过滤是一项至关重要的功能。它主要用于防止用户发布包含不当、违法或有害信息的内容。本篇文章将深入探讨Java中实现敏感词过滤的技术和方法。 首先...
问题描述:很多网站会对用户发帖内容进行一定的检查,并自动把敏感词修改为特定的字符。 技术要点: 1)Python正则表达式模块re的sub()函数; 2)在正则表达式语法中,竖线“|”表示二选一或多选一。 参考代码: ...
本资源“网站敏感词检测源码.rar”提供了一种解决方案,包含了四种不同的算法,帮助开发者实现这一功能。接下来,我们将深入探讨这四种算法及其在实际应用中的价值。 1. **Aho-Corasick算法**:Aho-Corasick算法是...
- 禁词树:可以理解为一种优化的Trie树,除了存储敏感词外,还记录了敏感词出现的频率或其他相关信息,用于更高效地管理和过滤敏感词。 六、实际应用 这类敏感词过滤类广泛应用于社交媒体、论坛、博客评论等场景,...
在IT行业中,尤其是在网站开发和社交媒体管理中,过滤敏感词是一项重要的任务,它涉及到内容审查、信息安全和用户体验。本文将详细探讨PHP实现敏感词过滤的工具及其相关知识点。 首先,我们要明白什么是敏感词。...
在IT行业中,尤其是在网络应用和社交媒体平台开发中,敏感词过滤是一项重要的技术。它主要用于防止用户发布或交流可能引起法律纠纷、违反社区规定或者不适宜的内容。本篇将深入探讨如何在C++与Qt框架下实现敏感词...
在Java编程语言中,敏感词过滤是一项重要的任务,特别是在处理用户输入、社交媒体分析、文本审查等场景中。这个话题涉及到如何有效地检测并替换或者屏蔽文本中的特定词汇,以符合法律法规或者平台规定。以下是对...
在Android开发中,敏感词过滤是一项重要的功能,尤其在处理用户输入、聊天内容或社区交互时,确保内容的合规性和安全性至关重要。本文将详细介绍如何在Android应用中实现敏感词过滤,以及如何使用提供的`TestFliter`...
本项目“网络敏感词过滤.rar”提供了一个自定义敏感词列表的解决方案,通过编程方式实现敏感词的屏蔽,确保网络内容的合规性。 首先,我们要了解什么是敏感词过滤。敏感词过滤是一种文本处理技术,主要应用于社交...