首页 > 新闻 > 国际 >

为Siri提供语音识别的Nuance正努力成为你的数字助理

2013-08-23 09:49:29   作者:Parmy Olson   来源:福布斯   评论:0  点击:


为Siri提供语音识别的Nuance正努力成为你的数字助理

  在Nuance的硅谷分公司,有一间很小但很温馨的小屋。

  产品主管Sean Brown手持一部Android智能机摆弄着Nuance下一个重量级产品:Wintermute,这是一款已历时一年多但仍未完成的虚拟助理产品。他对着手机说“Paul Pierce球打得如何?”(Paul Pierce著名NBA球员)。随即一个女声踉跄的回答:“在今天的比赛中Paul Pierce得13分3个助攻。”

  因为Nuance会保存Brown的所有询问,所以当他躺在卧室的躺椅上,告诉支持Wintermute的电视机“我要看比赛”时,Wintermute就会依据Brown的个人情况做出播放卡尔特人比赛的操作。收集与我们相关的数据并存放在云端,然后供机器更好的理解和预测我们的需求,Nuance正是想以这种方式来改变我们对机器的使用。

  在此之前,你一定已使用过Nuance的产品。最著名的就是Dragon Dictation,Siri、三星的S-Voice、自动呼叫中心以及航空公司和银行的虚拟助手,乃至世界上大多数智能机,他们的背后使用的都是此项技术。

  2012年Nuance营收17亿美元,净利5.56亿美元,该公司从2007开始就以39%的增长率增长。但最近Naunce下调了2013年的预期收益。尽管现在竞争越来越激烈,但Nuance仍然会继续收取授权费。Nuance的年度开发预算为$2.75亿美元,其研发人员有400人,目前在Wintermute上Nuance就投入了一大部分的预算和人力。

  问题是Google和苹果在语音技术上也在不断进步。最近苹果在波士顿建立了一个研究中心(距Nuance的伯灵顿总部只有15英里),前Nuance员工就在里面研究非Nuance版的Siri。渐渐地iPhone就可以做到去Nuance化,就像对Google地图那样。这点大大打击了Nuance的股价,自今年年初就已经下跌了14%,相当于2012年利润的41倍。

  Google的语音加人工智能技术,最典型的就是通过Google Now搜索网页。Nuance的语音技术基于统计推断,通过音素(音节)和上下文来进行识别。而Google则是使用名为深度学习的技术,该技术由人工智能大牛Geoffrey Hinton倡导,在2013年初Google聘用了他。Hinton的方法识别效果更好,而且还免费提供给安卓开发人员使用,但Nuance却还收授权费。同时Google还挖角Nuance员工,其中包括2004挖走联合创始人Mike Cohen来担任其语音技术主管。与此同时Google正朝着更强大的个性化搜索结果而努力。

  Paul Ricci担任了13年Nuance的CEO,他已做好了在语音辅助网络(voice-assisted Web)领域内一争高下的准备。Ricci在硅谷是出了名为达目的誓不罢休。在任务期内他完成了60次并购,有好几次都有着专利诉讼的威胁(Nuance官方记录有8次)。在森尼韦尔市的一间Nuance会议室中,Ricci说:“我不赞同这样的评价,有大量的卖家通过这些并购获得了大笔财富,他们对此也很满意。”稍后他又补充到:“当你运营一家公司时,唯一能做的就是创造长期价值。”

  如果Wintermute没能实现Nuance的目标,那么到时Ricci就无牌可出了。有一位投资人还宣称,“Nuance已处困局,如今它应该出售。”在2011年5月,就有传言说苹果有意收购Nuance,但当时被Ricci拒绝了。几年前甚至Google也有意收购这家市值60亿美元的公司,但现在Google发展了自己的语音技术。

  Carl Icahn因大量收购许多公司(如Dell)的股份而闻名,并促使这些公司改善或出售。目前他拥有Nuance的16%股份。现在他又说在苹果取得较高地位,这使得他的股票周三上涨2.4%。虽然这名亿万富翁对此做任何说明,但分析人士猜测今年夏天他就会要求Nuance出售其影像部门,或削弱Ricci作为CEO的权利,又或者出售给像IBM这样的金主。

  要Wintermute创造出收益估计还要一段时间。Naunce在6月给福布斯做的demo,仍处于今年1月在拉斯维加斯的消费类电子展时的demo相同的阶段。德意志银行的Nandan Amladi说:“目前Wintermute看上去更像一个科学项目,看不出盈利能力如何。”

  Nuance有一半的收入来自于医疗工业。数以千计的医护工作者通过Nuance的产品来将语音转录成笔记。手机上的收入只占总销售的四分之一,如果手机制造上不使用其技术,占比则会更少。尽管2012年全球智能机销售增长了43%,但根据高德纳公司的估计Nuance的移动部门只增长了29%。

  Wintermute如果要大获成功,Naunce就必须下调授权费,这样才能让该项技术遍布用户的生活。“我们同电视和智能机制造商有很紧密的关系,最终该技术将会融入系统中”,Ricci如是说。

  Ricci估计要实现那样的目标还需要几年的时间。但是三星、eBay这样的巨头会愿意将自己的数据提供给Nuance吗?Nuance的首席创意官Gary Clayton说:“会的,因为我们就是瑞士,是中立方。我们可以和任何人合作。”但当询问eBay的一名发言人是否愿意向Wintermute开放数据时,他回答说:“我们不会外泄任何数据。”

  数字助手应用Cue的联合创始人Daniel Gross说:“个人智能助理的发展充满着困难和未知。”他为了解决这个问题,已经同14名工程师共同工作了3年。“做我们这行最大的问题就是难以专注,你可以提出一份非常好的产品路线图并将它当为‘白标软件’售卖,也可以提出一个足以改变世界的用户产品路线图。但只有专注某一个才能成功。”

  光改进Nuance现有的语音技术就需要花费大量时间。Ricci认为至少还要过10到20年,语音技术才能发展完善到能足以判断我们的意图。Ricci坚信这项技术具有很好的前景,淡定前行即可。

  已在硅谷度过了大半辈子的他对这个地方有些担心,他担心硅谷已变得比过去5-10年更加疯狂。考虑到Google、苹果以及Cue这样的公司正迎头赶上,投资者殷切的希望Wintermute能快点创建出Ricci所说的长期价值。

 

分享到: 收藏

专题