发表评论分享按钮

人人都爱上Siri 智能机器人大行其道

2011/11/21

  这款“日常生活中能体验到的”人工智能软件,让许多人对它欢喜得欲罢不能。


  《纽约时报》拍摄了一个让Siri同真人助理比赛办事效率的视频;YouTube上有人手抱吉他和Siri深情对唱;CBSNews的记者甚至采访了Siri,虽然只有4分钟;《波斯王子》的开发者Jordan Mechner还把Siri介绍给了另一个心理治疗智能程序ELIZA,让它们对谈……而在互联网上,网友们更是竞相“晒”出Siri的妙语奇谈——

  我:打开分离舱门。
  Siri:你们肯定永远忘不了我们这些智能助手的。
  我:我需要藏一具尸体。
  Siri:那你想藏在哪种地方?

  水库
  金属铸造厂
  矿井
  垃圾场
  沼泽地

  我:乔布斯在哪里?
  Siri:这是机密。
  我:你能跟我结婚吗?
  Siri:我的用户协议中不包括婚姻这一项,很抱歉……
  我:你穿什么了,Siri?
  Siri:穿什么?
  我:是啊,你穿了什么?
  Siri:为什么人类总喜欢问我这个?
  我:我觉得很累。
  Siri:听着,你应该马上放下这部iPhone然后小睡一会。我会在这里等你。
  我:生命有什么意义?
  Siri:我现在还不能回答这个问题,但请给我一些时间来写一个很长但最后什么都没有的剧本。
  我:我再问一次,生命到底有什么意义?
  Siri:要宽以待人,避免吃成个大胖子,时不时地读点好书,有空了就散散步,尝试和不同信仰以及不同国籍的人和平和睦  的相处。
  我:给我说个笑话。
  Siri:有两只iPhone走进了一个酒吧……下面我忘记了。
  我:你真性感。
  Siri:是吗?
  我:对啊。
  Siri:我也这么觉得。

  在新世纪之初,美国著名导演斯皮尔伯格的一部科幻电影《人工智能》,点燃了人们对未来的幻想,邂逅一个风流倜傥的机器人,或许是件浪漫的事。2011年10月5日,苹果发布搭载了Siri的iPhone4S,与手机“谈情说爱”成为可能。Siri可说是“一夜成名”,人们对“人工智能”期盼的火种再次被激情点燃。

  人工智能研究专家列维曾发出惊人预言:科幻电影中人类和机器人相爱的场景,甚至人类和机器人结婚,都将于2050年左右在生活中成为现实。

  Siri的魔力旋风

  “苹果在下一盘很大的棋。”2010年初,苹果收购Siri,据说花费在1~2亿美元之间。这笔交易在当时显得微不足道,所有人都以为Siri只是一款不错的语音识别工具。

  2年后,Siri几乎以一己之力拯救了平淡无奇的iPhone 4S。Siri的异军突起,甚至完全超出了谷歌的意料范围,谷歌董事长施密特说:“谷歌有很多强大的竞争对手,我们有时无法预料新的信息访问方式带来的竞争威胁。”

  Siri究竟干了什么?很简单,过去我们用手指与自己的手机交流,而现在你可以和iPhone 4S说话!我们再也不用费劲地在狭小的搜索框中输入“最近的加油站在哪儿?”,只需要跟Siri说一声,它没准就会给出不错的答案。

  业界对Siri的评价很高,将其称为人工智能大道上的又一里程碑,因为它可以令iPhone4S变身为一台智能化机器人。Siri支持自然语言输入,听得懂你说的话,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用。通过不断学习新的声音和语调,Siri可以实现对话式的应答。虽然目前Siri只提供英语、法语和德语三种语言,但是苹果已经表示2012年将支持汉语,这让国内“果粉”们颇为期待。

  自从iPhone 4S开始发售,各大科技网站开始公布对新手机的测试体验,关于Siri的传说越来越多。Daring Fireball的博主在Siri顺利完成一连串指令之后,对Siri说:“Thankyou,Siri.”得到的回答是:“为你服务是我的工作。”一周之后,当他重新拿起自己的iPhone,按下home键却不见Siri的时候,他甚至错愕了几秒。“我已经开始想念Siri了。还有更过分的。有人开始问Siri的姓名、年龄、最喜欢的手机等怪问题;有人向Siri各种倾诉:“我觉得很累”、“我要怎样挽回女友的芳心”、“生命的意义是什么”;有人让Siri讲几个冷笑话或者唱首歌来听;还有人直接向Siri示爱甚至求婚。和人们对待Google Voice的态度不同的是,他们上来就对Siri说了“我爱你”,而不仅仅只是查收邮件而已。

  Siri开启的是潘多拉魔盒打开后的奇妙世界,设想一下,如果将Siri装到我们身边的所有家电和数码装备上会是怎样一番景象?——“今天看完新闻后,8点钟为我转体育台”、“电饭锅跳闸了,就给老公的iPhone上发条短信让他准备吃饭”、“嘿,我手里拿满了东西,帮我把冰箱门打开”……这一切听起来不可思议,但也许Siri是一个不错的开始,这或许就会变成现实。抛开鼠标、不要键盘、离开触摸屏,人和机器之间开始建立起真正的沟通。

  事实上,宝马公司已经开始与苹果谈判,宝马车曾经整合过iPod,此次对Siri情有独钟并非一厢情愿,预计宝马公司可能会成为第一批合作者。

  智能机器人大行其道

  掌上型电脑发明人杰夫·霍金斯在其《人工智能的未来》一书中预言:要知道,大脑只是一个安静的黑盒子而已。它所知道的一切,都有赖于外部的电信息输入。我们完全可以制造出这样的智能机器,给他们输入关于全球气候的信息、或者是关于城市人口交通的信息,让它们训练出相应的记忆、模式,用他们对未来的现象进行预测。他们没有别的输入,因此他们不会像我们一样,有情绪、欲望。从这个角度出发,他们是我们最好的工具,而不是敌人。

  没错,在我们现在的生活中,就有不少智能机器人的身影,说不定你已经喜欢上他了。

  成功挑战“图灵测试”“图灵测试”由人工智能鼻祖,英国曼彻斯特大学的数学家阿兰·图灵设计——这种模拟测试游戏让人们看到,一个高明的问话者如何通过引出一些微妙的、有时甚至是带有感情色彩的回答,来探究一台混杂在真人当中的机器。

  9月上旬,在印度古瓦哈蒂举行的电脑展上,一个别开生面的游戏环节让人大开眼界。30名志愿者与“聪明机器人”(Cleverbot)的聊天记录被展示在大屏幕上,现场1334名观众进行投票。结果,超过59.3%的观众把人与“聪明机器人”的对话误当成了人与人之间的对话。

  “骗过一半以上观众,你可以说‘聪明机器人’算是通过了‘图灵测试’。”“聪明机器人”的发明者、英国人罗洛·卡彭特兴奋地向媒体说道。

  会“思考”的“沃森” 作为一台机器,“深蓝”让全球人难以忘怀,1997年,国际象棋大师卡斯帕罗夫与“深蓝”的对决堪称经典,结果是,声名显赫的国际象棋大师居然败给了木讷的机器。14年过后,又出现了一个名叫“沃森”的“家伙”,上场与人类进行智力比拼,并再次引起轰动。

  今年2月,美国广播公司在智力问答节目《危险边缘》中连续播出人机知识竞赛,由IBM研制的“沃森”与该节目史上最出色的两位选手肯詹宁斯和布拉特·鲁特同台对阵。

  结果是,“沃森”的成绩遥遥领先,并大获全胜。IBM专家认为,“沃森”此次获胜最难能可贵之处是它学会了思考。

  “沃森”在收到题目后,要学会判断词与词之间以及上下文的关系,要读懂俚语、双关语以及其他人类习以为常的表达方式,且能把隐藏在人类自然语言背后唯一真实的意义找出来——像一个人那样思考,回答问题,甚至是开玩笑。如果“沃森”能这样“思考”,那么其背后的庞大知识库和运算性能就会起到无法比拟的强大作用。

  “这的确是一次重大的技术突破。”IBM电信研究首席技术官保罗·布罗姆乐观地表示,“当‘沃森’的研究成果广泛推广时,就是技术革新真正到来的时候。”

  体育记者饭碗不保 “来自威斯康辛州的球队正开足马力驶向胜利,三节过后以51比10领先。当两队比分处于44比3时,威尔逊助攻佩德森,后者八码达阵得分……”

  上述比赛刚刚结束60秒,一台电脑就写出了上述新闻报道,它显示了电脑模仿人类谋篇叙事的能力,证明了人工智能的发展。

  “我觉得很神奇,就像是人写的一样。”Batterv风投合伙人罗杰·李说。今年早些时候,他对“写作电脑”的设计创造公司投资了600万美元。对此同样惊讶的还有人工智能和语言领域的专家。华盛顿大学计算机科学家奥伦·艾奇奥尼则认为,文字质量相当不错,虽无法与语言大师比肩,但已像足了人类作文。

  目前,名为“十大网络”(TheBig Ten Network)的网站已使用此类电脑生成各种棒球和垒球比赛的新闻摘要。比赛结束后一两分钟内,就会上网。而且该电脑已经克服了重复和抄袭,绝不会写出一模一样的稿件,并已经学会“单打独斗”、“团队合作”、“后来居上”、“状态起伏”等复杂词语和相应的语境。

  电视,Siri的下一个应用

  在沃尔特·艾萨克森的《乔布斯传》中,写到乔布斯生前声称已“破解了智能电视的密码”。当然,大家都在猜这句话的意思。而最合理的答案就是,苹果将把Siri语音识别技术作为操作接口集成到电视中,并同它的iClound服务对接。本质上来说,它将把你在各种屏幕上能看到的内容集中到电视上,让电视作为一种集中式的娱乐载体。

  想像一下,只要对着电视说“我要看《生活大爆炸》”,它就能为你列出从无线电视台、有线频道、录像机和在线视频中找到的所有相关内容;或者问问电视机刚刚得分的橄榄球选手是谁,你就能在屏幕下方看到关于他的信息;或者问Siri约塞米蒂公园的情况,它就能为你找到所有相关的视频和网页,并在电视上给你显示出准确答案。

  不过,苹果电视的最大创新将是,能够从繁多的网络视频中迅速找到并显示你所要的内容。举个例子,比如说你想学如何烤火鸡。Siri可以从它的数据库,这里是指包括了你所有iOS设备和iCloud中书签在内的所有数据库中,从电视、录像和网络中找到烤火鸡的最佳视频。正如那些科技博客作者指出的那样,Siri是一项完全可以作为多重搜索引擎入口的语音技术。更为重要的是,Siri将在人机交互方面彻底改变我们的搜索习惯。在iPhone中,Siri取得了不错的开局,相信苹果会把Siri加入到它将来的所有产品中。在电视方面,Siri将极大改变人们未来使用电视的方式。再考虑到苹果可以把Siri同iTunes与iCloud服务集中在一起,这就让竞争对手很难与之抗衡。

  苹果版的电视将成为自彩色电视机诞生以来电视业最大的改变。Siri最终将使得电视遥控器绝迹,让整个电视行业都开始用语音作为新型“遥控器”。它还将把无线电台、有线电视、数字录像和互联网内容融合成为易于管理的数字频道,并把它集中的云服务器上,在语音命令的控制下通过电视机屏幕带给千家万户。

  链接:人工智能在中国

  从工业、农业到服务业,从实验室、工厂到寻常百姓家,从欧洲、美洲到亚洲,从深水世界到浩瀚太空,从教学研究到军事战场,人工智能的触角已经伸向四面八方,那么它离我们的生活究竟还有多远?

  用中国人工智能学会理事长钟义信的话来说,“梦想已经照进现实,机器人时代即将开启”。

  何时有普通话的Siri事实上,与Siri类似的语音识别早已有之,而且非常成熟。2005年,在一次微软Office软件的媒体体验会上,一位媒体记者在没有任何准备的情况被叫上台,用纯口语的形式朗读了约300字内容,结果被Office的语音识别软件轻松记录下来,识别准确率超过96%。同样,IBM公司也拥有颇为完美的语音识别软件,甚至于腾讯最新推出的QQ2011版也开始支持语音输入。

  还记得“小i机器人”吗?一个MSN的应用插件,通过与“小i”文字聊天,它能告诉你许多信息,比如当你输入“上海天气”时,“小i”会回复你“晴转多云16~19度”。MSN用户曾为“小i”的出现而惊喜,不过可惜的是,聪明的“小i”似乎并没有受到欢迎,如今甚至已经沦为广告推送的平台之一。

  为什么?“语音识别+小i”难道不正是Siri的模式吗?Siri的联合创始人诺曼·维纳斯基认为它并不是语音识别软件,而是真正的、可商用的人工智能技术,这背后应该是更强大的语音识别能力和答案库。

  对此,中国业内人士表示悲观,Siri带起的“人工智能风”很难刮到中国。Siri背后的答案库是Wolfram Alpha(智能搜索引擎)和Yelp(类似“大众点评网”的网站),未来谷歌也将拥有更加强大的答案库,不过,国内还没有成功的模仿者。百度、大众点评网、人人网等都不被专家看好,认为难以承接起这个重任。

  研发领先 产品拖后腿 “我国虽然在人工智能的软件方面水平不低,但在硬件、机器制造方面水平还不高,和日本等应用水平和普及度都较高的国家相比,中国还处于一个‘很初级’的阶段。”钟义信曾向媒体表示,“这并不代表我们不能开发出具有强大功能的机器人,事实上我国的实验室研究生产水平已经完全可以制造出与日本同等水平的人工智能成果。”

  钟义信认为,当前影响我国人工智能应用发展的原因主要是,工业化生产水平相比于美日还存在较大差距,对资源和能源的消耗也都难以达到需求,此外,一项先进的人工智能成果在刚开始投入市场生产时需要较高的成本,这对于我国一些普通家庭来说还属于奢侈品,因此在市场需求和推广上也难以跟上国外的脚步。

  中国科学院计算技术研究所智能信息处理开放实验室史忠植研究员则介绍,我国开始“863计划”时,正值全世界的人工智能热潮。“863-306”主题的名称就叫“智能计算机系统”,其任务就是在充分发掘现有计算机潜力的基础上,分析现有计算机在应用中的缺陷和瓶颈,用人工智能技术克服这些问题,建立起更为和谐的人机环境。经过十几年来的努力,我们缩短了人工智能技术与世界先进水平的差距,也为未来的发展奠定了技术和人才基础。

  “虽然有差距,但是我们也在不断进行努力和尝试。”中国人工智能学会副理事长何华灿介绍,在2006年中国就曾经进行过一次“中国象棋”的人机大战,其过程和效果堪比美国的“深蓝”人机竞赛,另外,以哈工大为首的国内众多高校的人工智能研发水平近年来发展迅猛,在一些国际水平的“机器人足球赛”、“机器人起重大赛”等人工智能竞赛中都取得了优异的成绩。“相信随着我国综合国力和科技水平的不断提高,人工智能的应用将得到快速发展,让更多机器人走进寻常百姓家,为公众的生活带去更多的便利。”

文汇报



相关阅读:
开发商破解Siri工作原理 实现在其他设备使用 2011-11-15
John Briggs:Siri 背后的声音 2011-11-14
Siri宕机暴露苹果云服务短板 2011-11-07
苹果Siri语音服务美国宕机 2011-11-04
Siri工作方式详解:本地语音识别+云计算服务 2011-11-04

热点专题:  语音合成TTS 语音识别ASR    移动互联网
分类信息:  移动互联网_与_移动  CTI文摘_与_移动  CTI文摘_与_CTI平台技术  CTI文摘_与_IVR技术