`
sulifeng
  • 浏览: 40902 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

<转载>--研究者开发程序可分辨讽刺类语言

阅读更多

        虽然这个程序能辨别反讽内容,但暂时还无法直接给“谢耳朵”提供帮助.

        在热门美剧《生活大爆炸》中,最受欢迎的角色“谢耳朵”患有社交障碍症,特征之一就是分不清“好赖话儿”,常常错把人家的讽刺当恭维,因此闹出了不少笑话。近日,有研究者开发了一种程序,可以分辨出有讽刺意味的语言。未来,或许这种技术可以帮助“谢耳朵”这样的人摆脱“不识反讽”的社交障碍。
研究源于恶作剧

        这种程序的开发者是以色列耶路撒冷大学的计算机科学家苏尔(OrenTsur),近日在美国华盛顿的人工智能进步组织大会上展示了自己的研究成果。
         讽刺性的语言其实是一种否定和攻击,但它的语气比直接的攻击要平缓一些,通常从中看不出任何关涉到批评和攻击的词,也正因为如此人们往往会对它们听而不闻,视而不见,而有社交障碍的人识别讽刺性的语言就成了一件非常难的事。苏尔和同事们开发了一种电脑程序,可以从网上社区里识别讽刺性的语言。

         虽然这个程序距离理解人类语言所有细微的幽默成分为时尚远,但它可能会帮助公司了解消费者如何看待他们的产品。比如说,一个购物网站允许消费者贴出自己对产品的看法。一则评论说:“这个镜头的大小真合适,我可以把它装在衣兜里。”而另一则评论说:“这个镜头的大小真合适,我需要买个泡菜坛装它。”前一个是夸奖,后一个是讽刺,但如果只从字面上来看,两者表达的意思似乎是类似的。公司会用一种电脑统计系统来统计用户的反馈,但是一般的语言统计系统无法识别讽刺性的语言,苏尔说:“在上面的例子中,一般的统计系统会下结论说,所有顾客对他们的镜头大小都很满意,这显然是不对的。”

         有趣的是,苏尔想要开发这种电脑程序的念头正是来自一个玩笑。当苏尔还是学校新人的时候,他曾经接到过一封电子邮件,表示感谢他对以往会议的贡献,邀请他当今年会议的主-席。

        这封信显然应当发给另一个人,但是苏尔玩心大发,以讽刺性的语言回了一封信。结果对方没有看出讽刺性的语气,以很正式的语气又回了一封邮件,询问他主要的研究领域是什么。苏尔回信说:“我的研究领域就是如何探测电子邮件中的讽刺性语言。”从此,苏尔开始很认真地研究讽刺性的语言.
                        
机器发现讽刺特征

        苏尔利用“机器学习”的方式开发了一种电脑程序。在开始的时候,他和同事给电脑输入80句讽刺性的句子,以及作为对比的几百句非讽刺性的句子,这些句子都是他们从“亚马逊”的读者评价中找到的。这些讽刺性的句子包括:“为了这么本书去砍树(造纸)?”“对于失眠症患者很有用”“iPod是被故意设计得两年后失效吗?”“那些缺陷是故意设计出来的”等等。

        这个程序分析了讽刺性和非讽刺性的句子,总结出讽刺性句子的几百条特征。其中一个讽刺性语言的特征就是如果句子的开头是“我猜”,而结尾是省略号,它通常是讽刺性的。比如:“我猜你们的这个镜头是用来装饮用水的……”“我猜穿着你们的衣服可以去约会凤姐……”再比如说超出必要地运用大写字母。苏尔在他的学术论文中说:“我们发现了讽刺的强烈特征,但是更多的细致的特征的组合可能是识别讽刺的最好手段。”

        他们还发现了一些和讽刺有关的有趣现象,总结了三大定律。定律1:流行定律,最受欢迎的产品往往遭讽刺最多。比如在亚马逊网站上,收到讽刺性评论最多的恰恰是卖得最好的产品,比如小说《达·芬奇密码》。苏尔说:“我们推测在网上运用讽刺性语言的一个强烈的动机是想要‘拯救’或者‘启发’大众,矫正不应得的好评。”定律2,简单性定律。如果产品有缺陷,它的功能越少受到的讽刺越多。定律3,价格定律,价格越高的产品越容易受到讽刺。

                             
帮助社交目标尚远

        为了实验这个程序是否有效,他们把200个评论交给3个独立的受试人,结果爱试人的看法和机器的看法有80%是相同的。研究者认为机器分析数以百万计的句子,结果也会差不离。苏尔表示,这个程序不仅可以帮助统计产品的网上评论,而且经过发展之后可以用来帮助有社交能力障碍的人。

        加利福尼亚大学心理学博士兰金表示,这个程序的表现还远称不上完美,可能因为讽刺是一种非常复杂的社会产物。兰金评价说,机器的表现只能和社会交往能力很差的人类相当。可能这样的程序可以帮忙统计评论的正负意见,但是“如果你的目标是帮助社交能力不佳的人士,我不能完全肯定他们真能从中获益。”

        比如,一个人说:“我太爱爱爱爱爱在周六工作了!”这句话是不是讽刺呢?如果背景是领导强迫员工在周末加班,这句话就是讽刺,但或许有人喜欢在周末工作,平常休息,这种情况这句话就不是讽刺。说这句话的时候,人的眼神和语气会包含很多信息量,但是在网上看不到这些。

        兰金说:“我们的大脑可以采集复杂的社交信息,处理很多微妙的事情,电脑距离这步还有很远。”




分享到:
评论
1 楼 sulifeng 2011-05-03  
记得当年我转这篇文章的时候,根本不知道"谢耳朵"是何方神圣.
如今已经把生活大爆炸的第四季都快看完了.
时光飞逝.

相关推荐

    JSF与Shale开发用包

    validator.jar&lt;br&gt;jakarta-oro.jar&lt;br&gt;jstl-api.jar&lt;br&gt;jstl-impl.jar&lt;br&gt;myfaces-api.jar&lt;br&gt;myfaces-impl.jar&lt;br&gt;jstl.jar&lt;br&gt;standard.jar&lt;br&gt;jsf-api.jar&lt;br&gt;jsf-impl.jar&lt;br&gt;jsp-api.jar&lt;br&gt;servlet-api.jar&lt;br...

    网页编码转换

    &lt;br&gt;功能:功能齐全,可以说都能转换,万能的&lt;br&gt;-----------------------------------------&lt;br&gt;以上程序,绝对值得你下载,机会不能错过哦!我可收集了好久猜得到的,现在全部打包,共享给大家

    [原创]用SWT/JFace实现的深路径自动生成软件(附源码)

    &lt;br&gt;Adjustable window: All bounds of window are adjustable now.&lt;br&gt; &lt;br&gt;LOG:&lt;br&gt;&lt;br&gt;--------------------------------------------------------------------------------&lt;br&gt;&lt;br&gt;2008-04-02&lt;br&gt;1. 添加...

    t淘淘商城项目 商城项目 视频和源码教程 详细

    &lt;commons-fileupload.version&gt;1.3.1&lt;/commons-fileupload.version&gt; &lt;jedis.version&gt;2.7.2&lt;/jedis.version&gt; &lt;solrj.version&gt;4.10.3&lt;/solrj.version&gt; &lt;/properties&gt; &lt;dependencyManagement&gt; &lt;dependencies&gt; &lt;...

    软件工程标准文档模板及示例(word)

    标准文档有:&lt;br&gt;可行性与计划阶段--可行性研究报告.doc&lt;br&gt;可行性与计划阶段--项目开发计划.doc&lt;br&gt;需求分析阶段--数据要求说明书.doc&lt;br&gt;需求分析阶段--需求说明书.doc&lt;br&gt;需求分析阶段--用户手册概要.doc&lt;br&gt;概要...

    正则表达式文法(BNF)

    &lt;elementary-RE&gt;::=&lt;group&gt;|&lt;any&gt;|&lt;eos&gt;|&lt;char&gt;|&lt;set&gt; ``` **解释:** - `&lt;elementary-RE&gt;`定义了元素正则表达式。 - 包括`&lt;group&gt;`(分组)、`&lt;any&gt;`(任意字符)、`&lt;eos&gt;`(行尾)、`&lt;char&gt;`(字符)和`&lt;set&gt;`...

    基于知识图谱的《红楼梦》人物关系可视化及问答系统(含码源):命名实体识别、关系识别、LTP简单教学

    1) app.py是整个系统的主入口&lt;br&gt; 2) templates文件夹是HTML的页面&lt;br&gt; |-index.html 欢迎界面&lt;br&gt; |-search.html 搜索人物关系页面&lt;br&gt; |-all_relation.html 所有人物关系页面&lt;br&gt; |-KGQA.html 人物关系问答...

    简化极小3-3-1模型中的μ子磁矩异常

    &lt;msub&gt; &lt;mrow&gt; &lt;mo Stretchy =“&gt;(&lt;/ mo&gt; &lt;mi&gt; g &lt;/ mi&gt; &lt;mo&gt;-&lt;/ mo&gt; &lt;mn&gt; 2 &lt; / mn&gt; &lt;mo Stretchy =“&gt;)&lt;/ mo&gt; &lt;/ mrow&gt; &lt;mi mathvariant =“&gt;¼&lt;/ mi&gt; &lt;/ msub&gt; &lt;/ math&gt;在减少的最小3- 最近在文献中...

    深入体验Java Web开发内幕

    &lt;br&gt; 本书适合所有Web应用的开发人员、Java程序员在工作和学习中参考阅读,也适合作为相关专业本科生、研究生的学习参考资料,也可作为相关培训机构的培训教材。&lt;br&gt;【作者简介】&lt;br&gt; 张孝祥中国著名IT培训教育...

    powerbuilder案例开发集锦(源码光盘)1

    &lt;br&gt;&lt;br&gt; 源程序使用说明&lt;br&gt;一、功能&lt;br&gt;&lt;br&gt; 本光碟中提供了与图书完全一致的程序源代码和编译好的可执行文件,读者可以直接执行这些可执行文件,以便更加直观的体会案例运行的效果;如果想进一步研究案例的源代码...

    Spring 3.0 整合Ibatis 3

    &lt;property name="initialPoolSize"&gt;&lt;value&gt;${jdbc.initialPoolSize}&lt;/value&gt;&lt;/property&gt; &lt;property name="minPoolSize"&gt;&lt;value&gt;${jdbc.minPoolSize}&lt;/value&gt;&lt;/property&gt; &lt;property name="maxPoolSize"&gt;&lt;value&gt;${...

    portal(struts)

    ### Struts与Portal开发知识点详解 #### 一、概述 本文档主要介绍如何结合Struts框架进行Portal(门户)开发的基础步骤,特别是针对初学者。Struts是一个基于MVC架构的开源Java Web应用框架,而Portal则是一种集成...

    Xarm 1.0

    因此在系统底层开发、实时控制、数据 &lt;br&gt;采集、高强度计算、逆向工程、密码破解、网络攻击、黑客工具、病毒攻防等领域汇编语言有不可替代的 &lt;br&gt;作用。如果想在安全领域成为高手汇编语言是基本功! &lt;br&gt;&lt;br&gt;&lt;br&gt;二...

    SpringMVC+Mybatis+Maven项目搭建(IDEA)

    在IT行业中,构建Web应用程序是一项常见的任务,而SpringMVC、Mybatis和Maven是Java开发者经常使用的三大框架。本文将详细介绍如何使用这些技术在IDEA集成开发环境中搭建一个项目。 首先,SpringMVC是Spring框架的...

    小程序如何获取用户名和头像-常用的2种方法,供大家学习研究参考~

    &lt;page-layout&gt; &lt;view slot="header"&gt; &lt;header-navbar title="个人信息"&gt;&lt;/header-navbar&gt; &lt;/view&gt; &lt;!-- 关键代码 start --&gt; &lt;view slot="scroll" class="content"&gt; &lt;view class="row"&gt; &lt;view class="text1"&gt;...

    编译原理-文法和语言

    编译原理是计算机科学领域中的一门重要学科,它主要研究如何将高级语言编写的源程序转换为机器能够执行的目标代码。在这一过程中,文法起着至关重要的作用,它不仅是定义语言语法的工具,也是编译器设计的基础。本文...

    outlook addin

    打开文件OAddin.rgs,在文件末尾插入以下代码:&lt;br&gt;HKCU_Software&lt;br&gt; {&lt;br&gt; Microsoft&lt;br&gt; {&lt;br&gt; Office&lt;br&gt; {&lt;br&gt; Outlook&lt;br&gt; {&lt;br&gt; Addins&lt;br&gt; {&lt;br&gt; 'OAddin.OAddin'&lt;br&gt; {&lt;br&gt; val FriendlyName = s 'SMIME ...

    TrayIconMan0_0_0002

    : F:\masm32\works\TrayIcon\TrayIconMan.exe&lt;br&gt;属性 : A---&lt;br&gt;语言 : 中文(中国)&lt;br&gt;文件版本 : 0.0.0002&lt;br&gt;说明 : TrayIconMan | 系统托盘图标管理员&lt;br&gt;版权 : PurpleEndurer&lt;br&gt;备注 : &lt;br&gt;产品版本 : 0.0....

Global site tag (gtag.js) - Google Analytics