阅读更多
引用
作者简介:洪亮劼,Etsy数据科学主管,前雅虎研究院高级经理。长期从事推荐系统、机器学习和人工智能的研究工作,在国际顶级会议上发表论文20余篇,长期担任多个国际著名会议及期刊的评审委员会成员和审稿人。
本文为 CSDN 原创文章,未经允许不得转载。欢迎技术投稿、约稿、给文章纠错,请发送邮件至heyc@csdn.net

2016年对于AI发展来看,是非常重要的一年。AI的各个领域都在蓬勃发展,同时,这一年,我们也目睹了一些在AI发展史上的标志性事件,比如阿尔法围棋战胜人类棋手,语音识别技术达到人类水平,各大云服务平台公司争先恐后进入AI平台开发领域。本文希望能够从几个关键领域和发展方向,在繁多的科技进步中,理清关键信息,对过去一年的经典技术发展做出点评,给读者一个清晰而简单的信息参考。

阿尔法围棋(AlphaGo)
今年AI领域发展的重头戏无疑要数阿尔法围棋(AlphaGo)。这是AI领域继1996年深蓝(DeepBlue)战胜卡斯帕罗夫、2011年Watson赢得“危险边缘”(Jeopardy!)之后,又一里程碑事件。阿尔法围棋的成功当然是一系列技术成熟被应用的产物,但是这里面最直接的贡献则得益于AI领域中强化学习(Reinforcement Learning)和深度学习(Deep Learning)这两个方向在最近几年发展中开花结果[1]。强化学习曾经长期只在有限的一些应用中得以使用,并且并没有得到主流学术圈的足够重视。然而,在Google DeepMind的学者把深度学习和强化学习巧妙结合在一起以后,越来越多的学术工作和技术发展已经着眼于考虑如何把强化学习的整套理论和实践应用到更多的领域,特别是利用深度学习和强化学习的结合[2]。传统的监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)以及半监督学习(Semi-supervised Learning)其实并不是真正意义上的“智能”。原因在于这些机制并不能对反馈进行有效地建模。而强化学习则是解决反馈的自然选择工具。如果说阿尔法围棋本身是一个现象级的进步,那么强化学习在这个过程中大放异彩则为今后很多研究方向的发展提供有利的技术平台。相信很快就会有学术和科技成果把相应的技术应用到其他领域,比如搜索和推荐系统。

聊天助理(Conversational AI)
聊天机器人或者语音助理是2016年被热炒的一个AI概念。在这个市场竞争的有已经比较成熟的聊天机器人产品如Google Now、苹果的Siri、亚马逊的Echo和Alexa,也有围绕这个概念诞生的创业公司如Operator、api.ai和Viv等。虽然应用场景各异,但大家的想法是一致的,那就是想在这股风潮中抢得先机,占领一个新的,有别于手机、桌面浏览器的用户入口。从技术层面上讲,聊天助理成为可能,实际上是借助于这两年语音识别技术的突破。从输入理解上,对话成为了一种可能。不过,聊天助理除了在一些狭小的应用领域可能短期内能达到自然流畅的效果以外,在普通的应用场景中依然有很长的路要走。微软研究院在Twitter上公布的聊天机器人,因为学习了粗俗的对话语言,导致开发人员不得不把聊天机器人撤下,并且道歉。这一例子说明,在语言领域,现状离真正的智能还有一段距离。

机器视觉(Computer Vision)
在机器视觉的技术和研究领域,今年的亮点无疑是“深度残差学习”(Deep Residual Learning )以及残差网(ResNet)[3]。这一在ILSVRC 2015大赛中赢得诸多第一名的方法,不仅正式夺得计算机视觉领域的顶级会议CVPR 2016的最佳论文,也奠定了其在一段时间内成为视觉领域标准算法的事实。无论是今年的ILSVRC 2016还是其他类似的机器视觉竞赛,各个参赛队都广泛使用了该技术。而残差网的论文也在短短一年之内就获得了超过700多次引用。残差网的主要贡献是发现了一条能够训练深层次网络而不损失模型性能的有效途径。在此之前,神经网络的层数一旦增多,训练方法很难有效得到优化的网络,模型性能不能得到提高,甚至有下降的可能性。残差网解决了这个问题,使得深度神经网络真正能够发挥多层的优势。目前,机器视觉的研发依然处于希望借助深度学习的各项成果带动视觉研发进一步发展的阶段。虽然各类问题都使用了深度学习来达到更好的模型性能,但这些技术是否帮助了整个领域更好地理解视觉问题,则是一个需要思考的话题。

语音识别(Speech Recognition)
和机器视觉类似,今年语音识别技术也再次被微软研究院的学者刷新了记录[4],单个词的错误率在9年月发表的一篇论文中被降低到了6.3%,而这一数字在几个月前举办的语音识别顶级会议Interspeech上才被IBM的团队刷新至6.6%[5]。接踵而至的最新成果,使得人们有理由相信在未来几年的发展中,语音识别有可能会被最快达到“人工智能”的标准。和机器视觉一样,微软及IBM的方法都广泛采用了深度学习技术。这是深度学习在近年来被广泛应用的桥头堡领域之一。值得一提的是,一些深度学习技术,比如CNN、ResNet以及类似LSTM,已经在视觉和语音识别同时被使用。究竟这些模型只适合于特定领域,还是它们最终能够解决绝大多数其他领域的问题,目前还没有研究能够回答。

推荐系统(Recommender Systems)
推荐系统在过去一年的发展平平淡淡。一方面有不少公司和技术方法已经非常成熟,在此基础上还要做出飞跃发展,近期不太容易从算法层面达到。另一方面,推荐系统又需要更多研究考虑如何提供更加成熟的优化对象,如何更好地描述推荐系统的有效性,这些基础工作依然方兴未艾。今年在推荐技术上比较有看头的发展,主要还是各种使用深度学习技术来提高推荐效果的尝试。其中值得一提的是来自Google使用TensorFlow的尝试[6]。Google工程师发现,单纯使用深度神经网络并不能很好地抓住需要推荐的上下文,很多有效信息在复杂的转换中丢失了。于是,他们提出了一种叫“宽而深”(Wide and Deep)的模型,用于解决同时抓住深度神经网能够很好泛化的能力,而“宽”的线性模型则能有很好的记忆能力。这样的框架在手机应用(App)推荐场景有了不错的效果。不过这样用比较“粗暴”的手段来混合传统的线性模型和深度神经网络是不是就是今后深度学习技术在推荐系统上的发展道路,我们还需要时间的检验。

大规模AI平台(AI Platforms)
2016年,越来越多公司投入到AI系统构建的风潮中。几大云平台公司都开始组建AI平台事业部,并且引进关键人才,确保自己能够在这样的竞争中抢得先机。亚马逊(Amazon)在年中引入了在卡内基梅隆大学如日中天的Alex Smola,担任亚马逊云(AWS)机器学习主管。Alex随后从学术界以及工业界引进了好几位资深AI专家,期望能够建立一个有竞争力的团队。之后,AWS频频出手,先在9月推出了新的支持深度学习的机器实例,又在11月正式宣布MXNet成为其官方指定的深度学习框架,让其平台成为了行业领头羊。在竞争对手方面,Google的云服务也不甘落后。虽然在具体的技术层面,依然十分依赖TensorFlow等Google的系列工具,但是在人才方面,11月份Google宣布从斯坦福大学和Snapchat分别挖来了AI专家Li Feifei和Li Jia两人,希望依靠两人的声望来组建团队,能够后来居上,和亚马逊形成竞争。其他公司也没有空闲,百度也在11月开放了情感合成、远场方案、唤醒二期技术和长语音方案等AI服务,供其他应用公司使用。微软则在今年9月份成立了AI研究中心由沈向阳担任领军人物,负责在AI的研发方面的人才、技术的整合。目前看来,在AI系统平台化的步伐上,Google和亚马逊是走在前面,另外公司则从应用的角度入手,希望通过开放特定的API来抢得这个市场的份额。

总结
在过去一年里,我们看到这么几个趋势:
  • 第一,深度学习继续在各个领域深耕发芽。现在的问题不是是否使用深度学习来推动某一个领域的发展,而是如何更好理解深度学习所带来性能提高后的结果,如何使用这些结果来更进一步引领我们对这些领域的理解。
  • 第二,平台竞争日渐白热化。各大IT平台供应商都意识到了AI是下一波浪潮的核心战场。各个厂商都在人才和技术的竞争中积蓄力量摩拳擦掌。
  • 第三,强化学习以及深度学习的结合可能会在更多的领域得到应用,阿尔法围棋的成功使大家看到如何对反馈信息建模和这样建模的功效。不过在这方面,依然有很多理论性工作需要完成。
参考文献
[1] D. Silver, A. Huang, C. Maddison, A. Guez, L. Sifre, G. van den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot, S. Dieleman, D. Grewe, J. Nham, N. Kalchbrenner, I. Sutskever, T. Lillicrap, M. Leach, K. Kavukcuoglu, T. Graepel, D. Hassabis. Mastering the Game of Go with Deep Neural Networks and Tree Search. Nature 2016.
[2] V. Mnih, A. Badia, M. Mirza, A. Graves, T. Lillicrap, T. Harley, D. Silver, K. Kavukcuoglu. Asynchronous Methods for Deep Reinforcement Learning. ICML 2016.
[3] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep Residual Learning for Image Recognition. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.
[4] W. Xiong, Jasha Droppo, Xuedong Huang, Frank Seide, Mike Seltzer, Andreas Stolcke, Dong Yu, Geoffrey Zweig. The Microsoft 2016 Conversational Speech Recognition System. arXiv 2016.
[5] George Saon, Tom Sercu, Steven J. Rennie, Hong-Kwang Jeff Kuo. The IBM 2016 English Conversational Telephone Speech Recognition System. arXiv 2016.
[6] Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen, Tal Shaked, Tushar Chandra, Hrishi Aradhye, Glen Anderson, Greg Corrado, Wei Chai, Mustafa Ispir, Rohan Anil, Zakaria Haque, Lichan Hong, Vihan Jain, Xiaobing Liu, and Hemal Shah. Wide & Deep Learning for Recommender Systems. The 1st Workshop on Deep Learning for Recommender Systems (DLRS 2016).

想要更多干货?请关注CSDN人工智能公众号AI_Thinker。
0
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 人工智能综述

    自2016年3月AlphaGo战胜世界围棋冠军李世石,人工智能也越来越成为社会关注的焦点, 伴随着人工智能应用的普及以及各界人士对人工智能未来的猜测,进而引发的人工智能威胁论也被社会各界人士所讨论。 该文首先介绍了...

  • 人工智能技术发展综述

    随着时代的进步,社会的发展,科技的进步,“人工智能”这一词语仿佛也变得不是那么遥远与陌生了。也随着人工只能技术的日益完善与进步,人工智能作为一种赋能技术,它将彻底的改变人时代的思想与传统认知。人工智能...

  • 人工智能历史、概念、算法与技术 概括与综述(一)

    随着大数据、云计算、互联网、物联网等信息技术的发展,各种各样的计算平台推动以深度神经网络为代表的人工智能技术飞速发展,从很大程度上打破了科学与应用之间的深厚壁垒,诸如图像分类、语音识别、知识问答、人机...

  • 综述:2016年人工智能的那些不完美

    综述:2016年人工智能的那些不完美---自动驾驶汽车、围棋人机大战、描绘机器人自我意识的美剧《西部世界》大热……2016年,人工智能及其相关领域受到产业界、学术界乃至全社会的热议。与此同时,人们对人工...

  • NLP技术发展综述

    NLP技术发展史2001 - Neural language models(神经语言模型)2008 - Multi-task learning(多任务学习)2013 - Word embeddings( 词嵌入)2013 - Neural networks for NLP2014 - Sequence-to-sequence models2015 ...

  • 人工智能发展历史概述

    人工智能发展道路上的大事记 ----------------详细版 从20世纪50年代开始,许多...

  • 新基建-AI人工智能行业重磅报告合集.zip

    新基建:AI人工智能行业重磅报告合集,共81份。 AI :人工智能影响力微报告 IT宿命系列之:云计算专题-云定义一切 IDC蓬勃发展,云计算大势所趋 AI芯片行业迎来黄金发展期 AI教育:人机交互与个性化学习引领产业...

  • 一文述说人工智能(AI)发展史,几经沉浮!

    本文从介绍人工智能及主要的思想派系,进一步系统地梳理了其发展历程、标志性成果并侧重其算法思想介绍,将这段 60余年几经沉浮的历史,以一个清晰的脉络呈现出来,以此展望人工智能(AI)未来的趋势。

  • 一口气看完人工智能发展与ChatGPT

    1950年,计算机科学之父发表了一篇论文《COMPUTING MACHINERY AND INTELLILGENCE》(《计算机器与智能》)提到了一个词。原始游戏是这样的:玩家A是男性,玩家B是女性,玩家C(扮演审讯者的角色)可以是任何性别。在...

  • 深度强化学习综述_兼论计算机围棋的发展

    尤其是谷歌深智(DeepMind)团队基于深度强化学习方法研发的计算机围棋“AlphaGo”, 在2016年3月以4:1的大比分战胜了世界围棋顶级选手李世石(Lee Sedol), 成为人工智能历史上一个新里程碑. 为此, 本文综述深度强化...

  • 人工智能(AI)极简史:发展历程、应用、风险挑战和未来趋势

    另外,模型需要独立同分布(i.i.d.)...本文主要从技术角度看待AI趋势多少是片面的,虽然技术是第一生产力,有着自身的发展规律,但不可忽视的是技术是为需求市场所服务的,技术结合稳定的市场需求才能得到长足的发展。

  • OCR技术发展综述与达观数据的实践经验

    2016年ECCV发表的CTPN是基于回归思想的经典技术(Detecting Text in Natural Image with Connectionist Text Proposal Network,论文出自中科院,为我们中国研究者点赞)。 CTPN是基于回归的文本检测中的经典方法 ...

  • 26份人工智能行业报告

    2016中国人工智能产业发展报告.pdf 2016中国人工智能行业系列研究——中国计算机视觉应用专题研究报告.pdf 2016人工智能生态报告(英文版).pdf 2016全球人工智能发展报告·产业与应用篇.pdf 2016全球人工智能发展...

  • 人工智能——综述1

    人工智能目前尚没有严格意义上的定义,一般定义:人工智能的基础包括:哲学、数学、经济学、神经科学、心理学、计算机科学、控制论、语言学等,是一门综合交叉学科。 1.2人工智能的演变历史 1.2.1人工智能的...

  • AI:人工智能的简介之AI发展史各种图片集合(人工智能三次浪潮、1943年~2006年、1308年到2016年)之详细攻略

    AI:人工智能的简介之AI发展史各种图片集合(人工智能三次浪潮、1943年~2006年、1308年到2016年)之详细攻略 目录 AI发展史 AI发展史 1、人工智能三次浪潮:Dartmouth会议→Hopfield网络→深度学习时代 第一...

  • AI综述专栏 | 神经科学启发的人工智能

    当前,人工智能科技迅猛发展,万木争荣,更应系统梳理脉络。为此,我们特别精选国内外优秀的综述论文,开辟“综述”专栏,敬请关注。 导读 近年来,神经科学和AI相关领域取得快速发展。在计算机...

  • 人工智能助力药物研发(AI制药综述论文)

    人工智能已应用于药物设计和开发过程的各个领域,如从多肽合成到分子设计、虚拟筛选到分子对接、定量构效关系到药物重新定位、蛋白质错折叠到蛋白质相互作用、分子途径识别到多药学等。人工智能原理已被应用于活性和...

  • 一图带你了解人工智能简史

    一图带你了解人工智能简史

  • C语言基础语法与程序设计入门讲解

    c语言入门 C语言一经出现就以其功能丰富、表达能力强、灵活方便、应用面广等特点迅速在全世界普及和推广。C语言不但执行效率高而且可移植性好,可以用来开发应用软件、驱动、操作系统等。C语言也是其它众多高级语言的鼻祖语言,所以说学习C语言是进入编程世界的必修课。hello,world #include<stdio.h>  int main() {     /*在双引号中间输入Hello World*/      printf("Hello World");     return 0;  } 注:在最新的C标准中,main函数前的类型为int而不是void c语言的具体结构简单来说,一个C程序就是由若干头文件和函数组成。#include <stdio.h>就是一条预处理命令, 它的作用是通知C语言编译系统在对C程序进行正式编译之前需做一些预处理工作。函数就是实现代码逻辑的一个小的单元。必不可少之主函数一个C程序有且只有一个主函数,即main函数。C程序就是执行主函数里的代码,也可以说这个主函数就是C语言中的唯一入口。而main前面的int就是主函数的类型.printf()是格式输出函数,这里

Global site tag (gtag.js) - Google Analytics