`

Siri究竟牛在哪里?深入解析苹果的人工智能助理

阅读更多

上周二,苹果发布了“新一代的”iPhone 4S,宣布将启用一项新的语音识别系统:Siri。很多人或许还没有明白Siri的重要意义,Cult of Mac网站对Siri进行了一番深入的解析,看过此文或许能让你更有理由相信,人工智能已经走进我们的生活。 



  说到 Siri,这是一道硬菜。可在 Android 上,这个功能一年前就有了,苹果不过是想在这方面“不输他人”,而且其功能也并非如此强大。对吧? 

  错。除了它确实是一道硬菜以外,其他的都错。 

  其实,Siri 是十年内移动平台上最重要的事件之一。 

  对 Siri 持否定看法的人一般会分成两个阵营:一边会说它没什么了不起的;另一边会说 Android 上之前已经有了。这两方的说法都不正确。 

Siri 的意义相当重大 

  我们不妨先从 Siri 的血统说起。Siri 直接发端于史上最大的人工智能项目:五角大楼的 CALO 项目。CALO 是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。 

  整个 CALO 计划的带头人名叫 Adam Cheyer,他现在也是苹果 iPhone 团队的工程总监。 

  在《麻省理工技术评论》的采访中,Cheyer 说 CALO 早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个模仿人类的助理中,帮助人们完成不同的事情。” 

  他形容说 Siri 计划就是寻求在一件消费产品中做同样的事情。其实,在过去的四年里,Cheyer 和他的团队一直在钻研如何优化 CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。在过去一年半中,他们把主要精力放在 Siri 技术和 iOS 及其应用程序的整合上。 

  它不是单纯的“声音识别”。它是人工智能。当人工智能进入了你的手机,难道意义还不够重大? 

Siri 和 Voice Actions 是两码事 

  Android 系统的 Voice Actions 也是一项伟大的技术,并已经被许多 Android 用户所熟知和使用。但说真的,它和 Siri 不是同一个层面的产品。 

  Voice Actions 提供了非常坚实可靠的声音识别引擎,它的高识别度把曾经一度流行的语音识别工具都比了下去。 

  不过,和过去的所有语音命令系统一样,它要求你说的话严格符合一系列特定的语法,否则它就无法理解。

  Siri 和以前公众使用过的所有产品都不相同。你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看也似乎是文不对题,但 Siri 会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。 

  打个比方,你想小睡一会,并准备上个闹钟,只需要说“20 分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?” 

  这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri 仍然能够理解。 

  对人类而言,这些句子再平常不过了。但要让机器去理解这些变化多端的棘手词汇,就是人工智能的圣杯了。 

  而更加人性化的特点是,一旦你开始和 Siri 进入一段对话,它甚至能理解许多含义模糊或者引申的语义。比如,你可以问它:“步行范围内有没有什么顶尖的意大利餐馆?”如果 Siri 查询后回答“没有”的话,你可以说:“那墨西哥的呢?”Siri 会将你的这个问题连同上文的“顶尖的餐馆”和“步行范围”一道进行理解。 

  Android 的 Voice Actions 做不到这样的事情,因为它是一个声控命令软件,而并非人工智能。 

  Siri 有时会为你显示网页搜索的结果,有时能替你执行一些操作,有时能够直接控制 iPhone 里的应用程序。 

  而且 Siri 同样能够回答问题,这要归功于它整合的 Wolfram-Alpha。你可以随机提问:“30 英里是多少公里?”,“巴黎现在几点?”,“钢琴上有多少个八度?”,或者“天空为何是蓝色的?”Siri 能够直接回答这些问题。不是唰地显示一个网页。就是回答你的问题。 

关于 Siri,重中之重是什么? 

  从历史和文明的角度来看,关于 Siri,最伟大的事情并非人工智能本身。而是苹果通过 Siri 把人工智能带进了现实生活中。 

  理由就是:苹果将 Siri 做成了 iPhone 的一个核心组成部分,并且让它作为手机使用的主流,让每个用户都觉得除了使用很方便之外,更想时时刻刻都尝试使用它。 

  提到“主流”,我指的是捡起那些被人类文明边缘化了的东西,并使其成为大量人群每日生活的一部分。现在,Google 出品的 Voice Actions 不得不面临被边缘化的境地。一般人甚至都没听说过它。 

  Siri 会成为主流的。人们会逐渐熟知它,甚至包括非 iPhone 用户。 

  爱迪生并不是发明灯泡的人。他是通过产品设计和市场营销,将灯泡变为主流的人。 

  福特并不是发明汽车的人。他是通过控制成本和市场营销,将汽车变为主流的人。 

  我们总是记住那些将事物变成主流的人,因为正是这些人和公司让科学技术真正融入每个人每天的生活。于是,说起灯泡,它就溯源至爱迪生;说到汽车,它就溯源至福特。 

  Google 的 Voice Actions 并非人工智能,虽说它确实让用户省去了打字输入、触摸操作的工序,只需要使用声音去控制机器就可以完成一系列事情。但是,Voice Actions 最终没有让声控成为主流。或许一些极客们会学着使用它吧。 

  然而,妈妈们会选择 Siri。 

And One More Thing(还有一件事) 

  iPhone 4S 也许会成为第一款支持蓝牙4.0 的手机,这项技术可以降低能耗,同时可以做到一件非常特别的事:唤醒设备。 

  如果把 Siri 和这项无线技术结合起来,其使用范围就更加广泛了。例如,可以想象你戴着一款“超长待机”手表,它会一直睡眠,你触摸它才会显示时间,或者在 iPhone 收到短信时,手表会被 Siri 唤醒。你如果要和 Siri 交谈,只需要对着手表说话就可以了,甚至连手机都不用掏出来。 

  同样,可以试想一下,有这么一款桌面麦克风,当你说话时会唤醒 iPhone,就像《星际迷航》里那样不用按任何按钮直接说话,并从企业号,呃我是说 iPhone 的人工智能,得到回应。 

  那么让我们来总结一下 Siri 对于人类而言意味着什么。Siri 是人机交互新纪元的黎明,是大众进入真正的人工智能时代的开端。 

  当然,目前它尚未达到完美,苹果目前将其定位在“beta”阶段。并且,它也还不是你在科幻电影里看到的那种无限高能的人工智能。 

  但它的步伐远未停止。iPhone 4S 里的 Siri 只是一个开端。相信以后会有更加复杂的版本出现。 

  Google、微软和其他公司也终会拿出自己的人工智能产品的(并且我预言就是按照这个排序)。 

  所以,一旦你最终和 Siri 搭上话了,请善待它。Siri 具有非常非常重大的现实意义,和以往任何产品都不同。它能够代表计算机发展的一个新纪元。当然,它会让每个人都“说”起来的。 

 

分享到:
评论

相关推荐

    仿Siri的中文语音助理源码

    这个项目对于开发者来说是一个极好的学习资源,它可以帮助他们理解语音识别、自然语言处理(NLP)、对话系统以及人工智能在实际应用中的工作原理。 【描述】"仿Siri的中文语音助理源码"提供了实现这样一个系统的...

    Siri语音助理源码

    在当今智能设备盛行的时代,语音助手已经成为了人机交互的重要桥梁,而“Siri语音助理源码”则是开发者们探索这一领域的重要资源。本篇文章将深入剖析这个基于Android平台的语音助理源码,带你了解其背后的实现原理...

    51CTO下载-Android源码_仿Siri的中文语音助理源码

    在Android平台上,开发一款仿Siri的中文语音助理是一项复杂且具有挑战性的任务。这个开源项目为开发者提供了一个很好的起点,让那些希望学习如何构建类似功能的初学者有机会深入理解语音识别、自然语言处理(NLP)...

    Android 仿Siri的中文语音助理源码.zip

    本文将围绕“Android 仿Siri的中文语音助理源码”这一主题,深入解析其中的关键技术点。 首先,我们要理解的是Android应用的基本架构。Android应用程序主要由Activity、Service、BroadcastReceiver、...

    安卓Android源码——精典源码之仿Siri的中文语音助理源码.zip

    【安卓Android源码——精典源码之仿Siri的中文语音助理源码】 这个压缩包包含的是一个针对安卓平台的语音识别与交互应用的源代码,它的目标是模仿苹果公司的Siri,提供中文语音助手的功能。源码的分析与学习可以...

    Android 仿Siri的中文语音助理源码.7z

    总的来说,这个“Android 仿Siri的中文语音助理源码”是一个综合性的项目,涵盖了移动开发、AI技术等多个方面,对于深入理解和实践Android语音应用开发具有很高的参考价值。通过学习和研究这份源码,开发者可以提升...

    Android仿Siri的中文语音助理源码.rar

    标题中的“Android仿Siri的中文语音助理源码”指的是一个专门为Android平台设计的应用程序,其功能类似于苹果设备上的Siri,即一个智能语音识别和交互的助手。这个源码项目可能包含了实现这一功能的各种组件和技术,...

    人工智能行业研究报告

    ### 人工智能行业研究报告 #### 一、人工智能行业概述 ##### 行业驱动——数据量、运算力、算法技术 自2000年以来,随着互联网技术的快速发展以及智能手机的普及,全球范围内产生的数据量呈现爆炸式增长。这些...

    赛迪智库:2017年智能技术发展趋势.pdf

    随着人工智能技术的不断发展,围绕AI的产业链也在逐渐形成和完善。这个生态链涵盖了基础设施建设、核心算法研发、应用平台搭建以及最终的解决方案提供等多个环节。在这个过程中,不同类型的企业通过分工合作,共同...

Global site tag (gtag.js) - Google Analytics