浙江日报 数字报纸


00006版:媒体点击

Siri会说话的秘密

  苹果iPhone 4S 手机自推出以来,Siri一直成为大众玩乐的目标之一,在网站“Shit that Siri Says”(看看Siri说了啥)上,用户已经上传了近千条和Siri的对话实录,受到网友热捧。人们热衷于问它一些困难的问题,而它总是回答得出人意料。

  有人问:“你是一个智能手机吗?”Siri的回答很经典:“等等……还有别的手机吗?”

  Siri在苹果的官方宣传中是个“智能个人语音助理”,具体的使用场景是这样的:你对着iPhone说一句话,“旧金山剧院附近的意大利餐馆”,Siri会做语音识别和自然语言理解,迅速查一些数据库,然后回答“离你不远哦,最近的一家走路十分钟”,并附上具体的地址、地图展示给你。再比如,你在开车时,对它说:“告诉我老婆我要迟到十分钟”,它会在通讯录里找到你的妻子,并发送这条消息给她。

  这已经接近人们想象中和电脑交流的方式。《纽约时报》撰文称:Siri代表着苹果的商业未来,也预示着未来“搜索”的形态。

  Siri的出身

  Siri所做的一切是如何做到的?人们有种种猜测。有个流传甚广的笑话:“Apple在印度的海德拉巴建了一个巨大的用户响应中心,所有用户和Siri的问题都被传到这里,然后客服人员飞快地打字回答。Apple内部把这个叫印度云(Indian cloud),简称iCloud。”

  真实的故事是,Siri脱胎于一个庞大的国防部项目,是一家总部位于旧金山的同名小公司,它诞生于2007年12月经济危机的寒冬中。2010年4月,苹果公司以大约2亿美元收购了这家公司,并将整个团队招致麾下。

  事实上,关于Siri,最伟大的事情并非人工智能本身,而是苹果通过Siri把人工智能带进了现实生活。

  Siri背后的人

  Siri发源于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写,该项目主要目标是:开发一个智能的个人助手系统。这个项目汇集了全球25所顶级大学和商业研究机构的300多名研究人员。在2007年该项目结束时,协作方之一的斯坦福国际研究院(SRI International)成立了Siri。

  整个CALO计划的带头人名叫亚当·奇也,他也是Siri的联合创始人之一,现任苹果iPhone团队工程总监。Siri公司的原首席技术总监汤姆·格鲁伯也是出身斯坦福大学的人工智能、语义网专家。

  在《麻省理工技术评论》的采访中,奇也表示:“CALO早已开始探索如何把对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考等全部融合到一个模仿人类的助理中,帮助人们完成不同的事情。”过去四年,他的团队一直在钻研如何优化CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。

  2008年10月,Siri获得第一轮约850万美元融资。当时的宣传语这样写着:全新的互动模式,拥有连接互联网消费者的智能界面。

  2009年5月,Siri整合一部分网络服务进入App Store,运行在iPhone 3GS上。但因为硬件和网络速度的局限,那时的Siri还不会说话,只能通过文字进行回应。

  2010年2月,带语音版本的Siri发布,免费提供3GS手机下载。这个版本已经能帮你找到和预订餐厅、电影院,提醒你各项日程,帮你预订从A处到B处的出租车。

  2010年4月,苹果正式收购Siri。关于这次收购的细节,都未向外界透露,2亿美元的价格也是估价。

  Siri的高明之处

  其实在人工智能领域,几大IT巨头从未停止脚步。Android系统的语音指示(Voice Actions)就是一项伟大的技术,并已经被许多Android用户所熟知和使用。遗憾的是,和所有语音命令系统一样,它要求用户说的话严格符合一系列特定的语法,否则它就无法理解。

  和他们相比,Siri最优秀的地方在于它的界面,你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看似乎文不对题,但Siri会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。你可以随机提问,“122的5次方是多少”,或者“天空为何是蓝色的?”这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri仍然能够理解,还有很独特的幽默回答。

  在技术上,Siri是人工智能专家的所有技术在友好界面上的整合,但它的潜力不止于此。如果苹果借此机会创建一个人工智能程序的生态系统,将Siri做成平台,让Siri与其他程序结合,内置的个人助理服务将更具使用价值。

  比如,有一款专注于帮助用户点餐的程序Alfred,它能从互联网获取数据来提供餐厅、咖啡、酒吧的选择建议。如果这个程序和Siri结合,也许你就不用问“离旧金山最近的意大利餐馆在哪里”,而是可以直接对Siri说“我要吃午饭”。

  难怪有人说,Siri的意义就像鼠标之父道格·恩格尔巴特在上世纪60年代发明鼠标那样令人振奋,苹果将用Siri开启另一场技术革命。   据外滩画报、IT世界


浙江日报 媒体点击 00006 Siri会说话的秘密 2011-11-12 2208520 2 2011年11月12日 星期六