首页>>>技术>>>语音应用>>>语音识别(ASR)  语音识别产品

发表评论分享按钮

神奇的语音技术 丢掉你的键盘拥抱语音搜索

2011/09/07

  有没有想过不论是手机还是电脑,都可以丢开键盘或鼠标,只要大声对搜索引擎说出你想要的,就能得到答案?下一代搜索技术之一“语音搜索”,能够帮你实现这些愿望。

  谷歌的语音搜索

  在两个月前亚太地区的“移动革命”大会上,谷歌工程师对着手机说“World Cup Soccer 2011”,显示的是关于这次女足世界杯比赛的信息,你会发现,日本女足取得了世界杯冠军;他又对着手机说“东京玩具商店地图”,则真的出现了一张标注了玩具商店地址的谷歌地图。这就是谷歌最新的语音搜索技术。

  6月14日,谷歌针对PC也发布了这一技术。谷歌并没有把手机语音搜索功能简单地移植到桌面,PC版语音搜索更为接近自然用户界面,而这种界面也是计算机开发者几十年来不断的追求。PC版语音搜索与智能手机版差别不大。与轻拍手机屏幕的话筒图标不同,用户可在Chrome浏览器中点击www.google.com搜索框的话图标。当然,用户需要把电脑连接话筒,或者佩戴耳麦。语音搜索可识别覆盖全球约50亿人的27种语言和方言,但用户界面目前还只有美式英文一种版本。8月25日,谷歌地图也发布了语音搜索功能键,用户可以直接用语音进行地点查询。据悉,此项新增服务是在6月发布的谷歌语音搜索的补充,用户可以通过计算机麦克风录入自己的目的地,进行地图搜索。该设计的目的是为了简化地图搜索,比如要查找一条名字拼写繁琐的街道,用户就可以采取语音输入的方式,只需要说明“从A地到B地”。

  “谷歌想要消除横亘在用户和想寻求的信息之间的所有障碍。具体到语音搜索,我们的目标是让用户随时随地能够使用语音识别技术,只要需要打字的地方,都可以用说话来代替。”谷歌语音搜索研究科学家Pedro Moreno在接受《电脑报》记者采访时表示,因为手机键盘和屏幕都很小,并且在触摸屏上很容易打错,打字会比较困难。但通过语音搜索,用户可以不再被这些问题所困扰,只需说出想要找的内容,就可以简单、快速地进行搜索。这对于那些输入困难的语言尤为重要,比如中文、韩语、日语、希伯来语、阿拉伯语等。

  据了解,相比传统输入,语音搜索功能可以容纳更长的拼读内容。Google语音搜索还有一项有趣的功能,当用户拼读算术题时,Google可以迅速提供计算结果。不过,目前,谷歌的语音搜索产品还并不是很成熟,办公室、室外等嘈杂的环境会影响它的搜索结果。

  无障碍搜索的愿景

  自电脑诞生以来,让电脑听懂人们的说话,一直是IT从业者的一大心愿。在单机时代,IBM是最早进行语音识别技术研究的企业,在上个世纪90年代就推出可用于声控打字和语音导航的语音识别输入软件IBM ViaVoice VIA。用户只要对着电脑讲话即可输入汉字,输入速度能达到150个汉字,几乎是键盘输入的2倍、普通手写输入的6倍。尽管售价不菲,但这套软件在全球已售出100多万套。汉王科技当年正是基于这套软件,开发出了基于语音和手写识别的手持设备。

  在比尔·盖茨预测的未来十年最重要的技术进步中,语音识别技术位居首位。微软则从Windows XP开始,在操作系统中添加了语音识别功能,在新推出的Windows 7里这一功能更为完善。不用键盘鼠标,用户可以通过语音对计算机进行简单的控制,如说一句“打开浏览器”,就可以轻松地打开IE。而Exchange Server 2010中则有更加先进的语音邮件预览功能,可以自动为语音邮件提供文本预览。不方便收听语音邮件的情况下用户可以先通过语音邮件预览来了解邮件的大致内容,也可以通过阅读文本预览来决定邮件的优先顺序。

  不过,真正让语音搜索为人们所知和应用的还是在手机上的尝试。手机的演化也为语音搜索的实现提供了硬件基础。现在几乎所有手机都拥有录音、照相等功能,智能手机的出现则让手机从一个单纯的通话装置变成一台小型的计算设备。

  越来越多的公司意识到,移动搜索领域会呈现与互联网搜索截然不同的人机交互方式。早在2008年,谷歌在美国发布了英文语音搜索服务Voice Search,应用于Android、诺基亚(微博)S60、黑莓、iPhone等多个系列的手机。据Pedro Moreno介绍,从那时起,谷歌已经将语音识别扩大到Android手机的每一个应用程序的每一个文字输入栏。

  谷歌的竞争对手微软也早早地进行了布局。2007年,微软收购了领先的手机语音识别服务厂商TellMe,组成了微软现在的语音团队,TellMe为包括411商务搜索、1-800-555的信息搜索以及美国航空在内的企业提供语音平台。微软新的语音团队最大的任务就是把语音搜索技术与Windows Mobile整合起来,移动版Bing搜索在三星(微博)手机上已经实现与谷歌类似的语音搜索功能。

  苹果也在布局语音搜索这个领域。2010年4月苹果收购了手机语音搜索厂商Siri。不仅如此,它和语音识别厂商Nuance也保持着密切联系。之前业界流传,在iOS5中有望加入类似于语音转文字或语音导航等高端功能。

  近日,腾讯手机SOSO V1.0(安卓版)正式上线,而语音搜索功能是该软件的亮点,用户只要说出搜索信息,即能立即进行搜索,大大简化了手动输入的操作流程。而前不久腾讯公司限量发售的小Q机器人产品也运用了“语音搜索”功能,相关负责人在接受本报记者采访时表示,集成语音搜索的小Q机器人产品未来希望能够在很大程度去替代传统的鼠标和键盘,成为人们上网的新助手。

  不过,手机搜索绝对不是终极目标,语音搜索功能将延伸为语音输入,覆盖到手机、电脑等各种终端上。

  “过不了多久,关键词搜索将会成为像电动打印机和黑胶唱片一样的怀旧产品,寄托人们对往昔时光的回忆。”美国华盛顿大学计算机科学家奥伦·埃奇奥尼日前撰文称,更好的搜索技术将能够支持语音搜索,并对输入的问题直接做出响应,或者是用自然的语言进行搜索并获得答案,而不是像现在这样使用索引来实现。

电脑报



相关阅读:
新世界的移动互联2.0 2011-08-31
移动互联网成未来“主角” 2011-08-30
运营商不甘“被边缘” 谋局移动互联网平台 2011-08-29
资本青睐无线市场 移动业务融资易成业难 2011-08-29
国内互联网创业潮遭遇资本寒流:谁是幸存者 2011-08-29

热点专题:  语音合成TTS 语音识别ASR    移动互联网
分类信息:  移动互联网_与_移动  移动互联网_与_互联网  移动_与_互联网