阅读更多
许多人认为Facebook只是一个蓝色图标的大型应用,或者认为只是个网站,但是近年来,我们已经建立了一套应用和服务体系,为用户之间相互交流和分享提供了广泛的方式。从文本到照片,再到视频以及将来的虚拟现实(VR),这个世界产生的信息量无时不刻都在增加。事实上,我们为您提供新闻材料所需要的数据量以每年50%的增量增长——因此我可以说,我们的标准工作时间跟不上这增长速度来处理这些数据。我能够想到跟上这种速度的最好方法是,构建一套智能系统来帮助我们清理泛滥的数据。

为了解决这个问题,Facebook AI研究院(FAIR)正在指导展开雄心勃勃的研究,诸如图像识别和自然语言理解等领域。他们在这些领域发表了一系列开创性的论文,而今天,我们将要宣布另外一些里程碑式的研究成果。

目标检测和记忆网络

第一个里程碑是计算机视觉的子领域,也就是目标检测。

目标检测是件困难的事情,以下图为例:



在图中你看到了多少匹斑马?很难看清,对吗?想想这对计算机有多么艰难,它压根就看不到条纹——它只能看到像素点。我们的研究人员一直在努力训练系统来识别像素中的模式,让计算机在一张又一张的照片中,区分物体的能力能够与人类不相上下甚至超过人类——业内叫做“分割”——然后识别每一个物体。我们最新的系统在分割图像的时候比其他大多数系统快30%,而使用的训练数据则是十分之一,这套系统将在下个月的NIPS上展示。



下一个里程碑式的研究是自然语言理解,使用了新技术记忆网络(即MemNets)带来了新的进展。MemNets在卷积神经网络中加入了一种短期记忆来推动深度学习系统,让这些系统可以像人类那样理解语言。今年的早些时候,我展示了MemNets工作的案例,阅读和回答关于《指环王》简短概要的问题。现在,我们已经将系统基于十多行文字阅读和回答问题扩展到能够在数据集上回答超过10万个问题,比之前要大几个数量级。

在计算机视觉和自然语言理解方面取得的成就本身就令人兴奋了,但真正令人兴奋的是将二者结合起来。看看下面这个例子:

视频:https://www.facebook.com/Engineering/videos/10153621574817200/

这个案例中的系统叫做VQA或者visual Q&A,你可以看到将MemNets和图像识别结合起来会发生什么:我们可以让人们提出照片中有什么的问题。试想一下,这种技术对世界上数以百万计有视觉障碍的人来说意味着什么。当在朋友之间分享照片时,他们并不会被冷落,而相反,他们能够参与其中进行互动。虽然这项技术还处于早期研发阶段,但是它的前景是明朗的。

预测和规划

我们在AI方面还有更大更长远的挑战。其中包括一些无监督和预测学习,系统可以通过观察(而不是通过直接指令,即监督学习)来学习,然后基于这些观察进行预测。这些都是你和我天生就会的——比如,没有人要到大学里才会学到如果将笔推下桌子它会掉落在地面上——并且人类大部分学习都是这样进行的。但是计算机仍然无法做到这一点——我们在计算机视觉和自然语言理解所取得的进展仍然由监督学习推动。

FAIR团队最近开始研究这些模型,你可以在下面的案例中看到我们一些早期成果。该团队已经开发了一套系统,它可以“看”一系列视觉测试用例——在此情况下,不可靠堆放的方块可能会也可能不会掉落——然后预测输出。在短短几个月的工作之后,这个系统的预测准确率达到了90%,比大部分人类的预测要准确。

视频:https://www.facebook.com/Engineering/videos

长远研究的另外一个领域是教系统进行规划。我们构建了一个系统来帮助实现这个目标,一个为棋盘游戏Go设计的AI玩家。使用游戏来训练机器在AI研究领域是很常见的做法。在过去的几十年中,AI系统在跳棋,国际象棋,甚至Jeopardy等方面超过了人类。但是,尽管在Go游戏AI玩家方面的研究已近50载,人类最好的棋手还是要比最好的AI玩家要更出色。这是部分因为Go中不同着子方法。比如,国际象棋中,在前两步着子之后,接下来会有400中可能的应对方法。在Go中,将会有近130000种。

视频:https://www.facebook.com/Engineering/videos/10153621562717200/

我们在Go玩家上工作了短短几个月,但是它已经能和一个已经发布的AI系统齐头并进了,并且它已经能和人类高手玩家相媲美。我们将传统的基于搜索的方法——随着游戏的进行对每个可能的着子方式建模——与我们计算机视觉团队开发的模式匹配系统相结合,以此来实现这个功能。最棒的人类Go玩家善于随着比赛的发展识别棋盘上的模式,使用这种技术,我们的AI玩家可以模拟人类的这种行为——可以得到非常准确的初步结果。

那么当你把这些全部聚集在一起会发生什么呢?Facebook最近正在运行一个小型的人工智能助手M的测试。不像其他的机器驱动服务,M考虑的更长远:它可以替你完成任务。它可以购物;安排礼品送到您心爱的人手中;预定餐厅,旅行安排,约会等等。这是一个巨大的技术挑战——这很难起步,M是一套人类训练的系统:人类操作员来评估AI给出的建议,然后他们对此进行回应,而AI则观察学习这些人类给出的回应。



我们最终希望将这套服务扩展到全球数十亿用户,但为了要做到这点,AI在没有人类帮助的情况下,需要能够自身处理大部分请求。要做到这一点,我们需要在M上建立上图中所有不同的功能——语言,视觉,预测和规划,这样它就能理解每个请求背后的上下文信息,然后未雨绸缪。这确实是一个巨大的挑战,而且我们才刚刚开始。但是早期研究结果是有希望的。比如,最近我们在M上部署了新开发的MemNets系统,促使M加快了学习:当有人要求M帮忙预定鲜花,M现在知道首先要问的两个问题是“你的预算是多少?”和“鲜花要送到哪?”

最后一点:有些人可能会这么认为,“那又怎样?人照样能够做这些事情”。当然,你说的没错——但我们大多数人没有专门的私人助理。而这就是类似于M服务提供的“强大能力”:我们可以为这世界上数十亿人提供他们自己的数字助理,这样他们就能够花费更少的时间在每天琐事上,而有更多时间处理真正重要的事务。我们的AI研究——探索连通性的全新方式以及使用Oculus VR身临其境地感受分享的经验——需要长期的努力。明白这一切技术原理,这将需要多年的艰苦工作,但如果我们能够正确理解这些新技术,我们离连通世界又近了一步。

想要了解更多关于我们人工智能研究以及已经产生的影响,那就看看这个视频。

视频:https://www.facebook.com/Engineering/videos/10153621590557200/

英文原文:Teaching machines to see and understand: Advances in AI research (译者/刘翔宇 审校/赵屹华、朱正贵 责编/仲浩)

关于译者: 刘翔宇,中通软开发工程师,关注机器学习、神经网络、模式识别。
  • 大小: 147.5 KB
  • 大小: 269.1 KB
  • 大小: 24.7 KB
0
0
评论 共 1 条 请登录后发表评论
1 楼 mnieguomin 2015-11-18 11:21
这个世界产生的信息量无时不刻都在增加....... 语法

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 大规模参数服务器上的神经网络训练优化——Facebook 研究团队进展报告

    作者:禅与计算机程序设计艺术 1.简介 ...为了加快训练速度,参数服务器(Parameter Server)模式被提出,将神经网络训练过程中的参数分配到多个计算机上,并通过统一的管理器进行调度和通信,从而减

  • 让机器看懂并理解,Facebook人工智能研究进展

    Facebook AI研究院在图像识别和自然语言理解等领域研究已久,本文主要宣布其目标检测、自然语言理解等方面里程碑式的研究成果。 许多人认为Facebook只是一个蓝色图标的大型应用,或者认为只是个网站,但是近年来,...

  • AI系统能否理解3D现实世界?Facebook做了这些研究

    Facebook 的博客详细介绍了其在 3D 内容理解领域的研究进展。 要想解释现实世界,AI 系统必须理解三维视觉场景。而这需要机器人学、导航,甚至增强现实应用等等。2D 图像和视频所描述的...

  • 【人工智能简史】第一章 引言 —— 人工智能的概念与定义、发展背景及相关领域、意义与价值

    人工智能作为一个概念和研究领域最早可以追溯到20世纪40年代至50年代。1956年,达特茅斯会议被认为是人工智能研究的开端。此后,人工智能经历了几次高潮与低谷,形成了今天的研究格局。在人工智能的发展过程中,学者...

  • “从视频中学习”——Facebook启动新AI项目,IBM早早探索出AI视频解析新方法?| 硅谷速递...

    随着我们日渐掌握越来越强大的计算能力、更先进的计算算法、更易用的软件系统,以及不断下降的数据存储成本,我们正在具备对无处不在的大量视频进行实时分析的能力。Facebook启动Learnin...

  • 《人工智能狂潮》读后感——什么是人工智能?(一)

    从本专栏开始,作者正式研究Python深度学习、神经网络及人工智能相关...本篇文章将分享《人工智能狂潮》书籍内容,包括人工智能的应用和什么是人工智能,结合作者的理解分享人工智能原理及基础知识,希望对您有所帮助!

  • 春节在家不再无聊,这份2019 AI研究进展回顾陪伴你

    2020-01-28 13:24:06 2019 年可以说是「预训练模型」流行起来的一年。自 BERT 引发潮流以来,...人工智能不仅已经玩转德州扑克、星际争霸和 Dota2 这样复杂的游戏,还获得了 Nature、Science 等顶级期刊的肯定。 ...

  • 人工智能发展趋势——深度AI科普调研团队

    1956年的达特茅斯会议首次提出人工智能的定义:使一部机器的反应方式像一个人在行动时所依据的智能。经过超过半个世纪的发展,人工智能已经渡过了简单地模拟人类智能的阶段,发展为研究人类智能活动的规律,构建具有...

  • 2018 年最值得期待的学术进展——致人工智能研究者们的年终总结

    来源:AI科技评论概要:这里,我们为大家奉上机器学习学者 Alex Honcha 所展望的 2018 年最可能产生突破的 AI 领域。2017年马上就要过去了,而 AI 也在2017年中得到了快速发展。研究人员们提出了很多有趣而又富有...

  • 机器学习(4)——弱监督学习

    针对这一问题,相关研究者提出了弱监督学习的概念,弱监督学习不仅可以降低人工标记的工作量,同时也可以引入人类的监督信息,在很大程度上提高无监督学习的性能。 弱监督学习是相对于监督学习而言的。同监督学习...

  • ​人工智能和机器学习中数据集的 3 个大问题

    来源:ScienceAI编辑:绿萝数据集为 AI 模型提供燃料,例如汽油(或电力)为汽车提供燃料。无论他们的任务是生成文本、识别对象还是预测公司的股价,人工智能系统都通过筛选无数示例来识别...

  • 人工智能、机器学习、神经网络和深度学习的发展历程(下)

    之前向大家介绍了人工智能和机器学习的发展历程,今天我们分享神经网络和深度学习这一段同样跌宕起伏且波澜壮阔的发展历程。 阅读链接:人工智能、机器学习、神经网络和深度学习的发展历程(上) 一、前言 在介绍神经...

  • 机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

    机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

  • 未来方向——从深度学习到超级智能体、人类与机器共赢

    随之而来的就是对人工智能系统的攻击和突破,特别是在人机交互领域。近年来人工智能技术取得重大进步,我国科技公司纷纷布局人工智能,成为行业龙头企业。随着计算机技术的飞速发展,智能机器人技术、无人驾驶技术等...

  • Meta AI发布具有200种语言的高品质机器翻译人工智能模型

    Meta AI所打造的NLLB-200是第一个能对200种不同语言提供先进质量翻译的单一人工智能(AI)模型。 Meta AI也建立了全新的评价数据集FLORES-200,并衡量NLLB-200在每种语言中运作的成效,以确认能够提供高品质的翻译...

  • NLP领域的最新研究进展

    为了回答这个问题,在本次 DataFun 举办的自然语言处理峰会上,我们邀请了NLP领域的领衔专家和学者,共同精选了大模型预训练、自然语言生成、多模态理解、人机对话与交互、信息抽取与检索、产业创新与实践、机器翻译...

  • 一文述说人工智能(AI)发展史,几经沉浮!

    本文从介绍人工智能及主要的思想派系,进一步系统地梳理了其发展历程、标志性成果并侧重其算法思想介绍,将这段 60余年几经沉浮的历史,以一个清晰的脉络呈现出来,以此展望人工智能(AI)未来的趋势。

  • 一文看尽Facebook 3D视觉技术研究进展

    点击上方“3DCVer”,选择“星标”干货第一时间送达作者:Georgia Gkioxari、Shubham Tulsiani、David Novotny参与:魔王来源:机器之心@微信公众...

  • 进入新公司一个月的一些感想

        因为今天收到了工资条,才发觉不知不觉已经进新公司一个月了。感受颇多,原来在九城做的时候感觉公司很大,做事情不能随心所欲,心里一直有一种畏惧感。我刚进九城3个月的试用期几乎没有做太多事情。主要是由于没有工作经验,不能很快领会leader的要求,因此经常挨批:)现在的公司在上海一共也就十几个人,技术人员就3个。没有开发人员。因此,感觉很不一样,不管是线上服务器还是公司内部其他员工的台式机都需要

Global site tag (gtag.js) - Google Analytics