首页 > 新闻 > 国际 >

Nuance在智能语音助手领域的长跑

2013-08-21 14:04:29   作者:   来源:雷锋网   评论:0  点击:


  你听过Siri,听过Google Now,但也许没有听过Nuance。事实上它的Dragon Dictation产品正是支撑Siri、S-Voice(三星)和全球一些顶尖企业呼叫中心背后的技术。

  在硅谷一座光彩熠熠的办公楼里,Nuance Communications的产品经理Sean Brown向我们展示了Android设备上他们的最新产品:Wintermute,一款已经打磨了一年有余的语音助手。

  Siri背后的技术

  他对着手机说道:“Paul Pierce(NBA球星保罗·皮尔斯)今天打得怎么样?”一个略微断音的女声答道:“Paul Pierce今天拿下13分,3个助攻。”

  Wintermute会将Brown的请求都保存在Nuance的服务器上,所以当他对着办公室的电视说“切到比赛”时,Wintermute会检索最近的内容然后切换到凯尔特人的赛事。

  Nuance就是希望以这样的方式改变人与设备的交互,同时随着云端数据的积累,设备们能越来越容易地领会用户的意图。

  你可能没听过Nuance,但很可能用过。Dragon Dictation是它的代表性产品,现在Siri、三星的S-Voice和部分全球顶尖企业的呼叫中心都在用着。你手机上很可能有Nuance的痕迹。

  这家公司去年的营收是17亿美金,净利润是5亿5600万,算下来从07年起保持了每年39%的净利润增长。相当不错的数字。

  但近期因为几家移动客户的订单延期,他们削减了对今年营收和利润的预计。尽管现在在语音助手领域的竞争加剧,Nuance无意削减他们的授权费用。Nuance每年的研发预算大致在2亿7500万美金,现在绝大多数都投入到了Wintermute上。

 Nuance在智能语音助手领域的长跑

  苹果、谷歌两座大山

  Nuance现在面临的最大问题是来自苹果和谷歌的竞争。

  苹果在波士顿新建的研究中心里,一群前Nuance工程师正忙于打造一款完全脱离Nuance的Siri版本。苹果这样做的目的自然是用自家产品将Nuance踢出iPhone,正如它当年对Google Maps所做的一样。这对Nuance的股价是一个沉重的打击,目前已经从年初下跌14%。

  另一方面,谷歌采用的则是语音+AI的策略。Nuance的语音技术采用的是数理统计方法,通过检索音素和语境来识别话语。但谷歌现在正转向AI领袖Geoffrey Hinton(13年加入Google)所倡导的深度学习技术。

  Hinton的实现比Nuance优越,但更棘手的问题在于谷歌将语音识别软件免费授权给Android开发者,这点Nuance做不到。谷歌也挖走了一部分Nuance的老臣,比如联合创始人Mike Cohen 04年投奔到谷歌的语音掌门任上。谷歌的数据也使其能在语音搜索上做更大程度的个性化定制。

 Nuance在智能语音助手领域的长跑

  背水一战

  Paul Ricci,Nuance过去13年的CEO,是硅谷出了名的狠角色。对他来说,Web语音助手这一仗势必要打。

  对公司当前的策略,Ricci这样评价道:“对于一家公司来说,你要做的最重要的一件事就是创造长期的价值。”

  但如果Wintermute最终没有带来Nuance想要的成功,Ricci的处境将非常困难。一位投资人这么表示:“(公司)现在是处在僵局。其实他们早就应该被收购了。”

  传闻苹果在2011年就表露过要将其招安的意愿,被Ricci一口回绝。据谷歌的内部人士消息,当年谷歌在着手自己的语音技术以前也曾考虑过要买下这家市值60亿美金的公司。

  公司要想在Wintermute上盈利可能还要酝酿相当长的一段时间。在2013的CES上,德意志银行的Nandan Amladi表示:“Wintermute现在看起来还只是一个科研项目,暂时还看不到盈利的途径。”

  Nuance的营收主要依靠医疗产业(占到营收总额的一半)。医生和医疗工作者们使用他们的软件来誊写各种文字。移动仅仅占到业务总量的1/4。但随着全球智能机销量在2012年增长了43%,Gartner预计Nuance的移动业务将增长29%。

 Nuance在智能语音助手领域的长跑

  Wintermute盈利之路漫漫

  Wintermute想要成功,Nuance必须拿下一大批包括竞争对手在内的授权订单,否则这项技术很难在汽车和手机上推广开来。Ricci表示他们目前正在跟电视和手机厂商们密切合作,未来这项技术将跟设备们浑然一体。但他预计这件事发生还要几年。

  还有说到语音助手还会涉及到跟合作商(比如三星和eBay这样的巨头)之间的数据调用,尽管Nuance的创意总监Gary Clayton表示不困难。但eBay的一位发言人曾公开表示过不会与Wintermute这样的服务有外部的数据分享。

  数字助手app Cue的创始人Daniel Gross表示当前智能助手市场的局面相当困难,并且充满了未知。

  Gross表示:“我们现在在业务上碰到的最大问题还是在集中精力上。一开始我们的设想非常宏大,甚至希望它是一款改变世界的产品。但这样的产品在变现的阶段往往非常困难。”

  对Nuance来说,仅仅提升现有的语音技术还需要时间。Ricci认为人们跟设备真正“对话”的实现还需要10-20年,那时的技术会非常容易理解我们的意图。但考虑到当前来自谷歌、苹果和Cue这样对手的压力,投资商们可能等不了这么久。

 

分享到: 收藏

专题