首页>>厂商>>语音识别与合成>>Nuance

发表评论分享按钮

采访Nuance高层:车载语音导航新篇章

2011/12/23

  泡泡网上海分站12月22日消息,在2011年12月7-9日,Nuance参加了在上海雅居乐万豪酒店举行的2011 Telematics @ China高峰论坛并展出最新的中文车载语音解决方案。而我们知道,Nuance通讯公司是世界领先的语音和语言解决方案提供商,企业级和消费级用户遍及全球。其提供的技术、应用软件和服务改变了人们进行信息交互,和创建、共享以及使用文档的方式,并很大程度上提升了用户体验。

  近日与中国领先的导航地图和动态交通信息服务提供商四维图新(NAVINFO)达成合作,双方将共同开发导航用的语音地图数据,并于NavInfo在2012年5月发布的新版地图同时推出用于语音导航的数据。四维图新将借助Nuance最新的字音转换工具,引领语音技术成为未来语音导航产品的趋势。在2011年12月8日,泡泡网有幸对Nuance移动语音部全球嵌入解决方案构架总监Brian Radloff、语音合成产品经理Dr Johan Wouters、顾问经理苏厚昌和上海研发中心总监张亚昕博士进行采访,听他们谈谈Nuance最近的一个市场发展情况和新的技术特点。


  首先张亚昕博士为我们演示了Nuance语音导航是怎么实现的。举了一个云端和本地端来结合的例子:


图:Nuance上海研发中心总监张亚昕博士


  系统:“请选择一个任务”

  Nuance:命令词控制。

  系统:“命令词控制,请说命令。”

  Nuance:发短信给刘涛,今天晚上七点图书馆见。

  系统:“发短信给刘涛,短信内容:今天晚上七点图书馆见。”

  “见”这个音是对了,字是错了。然后它这个是这样,我说的这一句话,这个语音识别的实现,实际是上本地和云端结合起来实现的。

  通过语音本地端完成了发短信给刘涛这个命令词的识别,识别完了以后,它把刘涛的电话号码从地址簿里边调出来,放在你这个短信的筐里头,然后把“今天晚上七点图书馆见”的这一段语音就发到云端,云端的识别器把它识别完了以后,把文本反馈回来,再填到这儿。所以刚才看到大家稍微有点等,在等的过程当中,实际上就是这个信号传到云端,云端识别几乎是不花时间的,因为它非常强大,然后再传回送。这个就是网络的传送时间,有时候等待时间,因为现在无线网络有时候也不是特别好。这是一个比较典型的一个例子。



  泡泡网:在看完张亚昕博士对Nuance语音导航的演示,请问一下如果编辑错的话,能不能修改?

  Nuance:可以修改。到你需要修改的那个“见”上,你再说“见”或者见面,它就给你弄过来了。但是我们觉得在中国区,在中文的修改上,这未必可能是个好办法,我们也在试探另外一种办法,这个办法我现在可以给大家介绍一下。就是这样,我要说修改,那么那个语音合成TS就开始给你再读,刚才不是读了一遍吗,它再给你读,但是这一次读,它是一个词一个词地读。他说,今天我不吭声,晚上,我不吭声,他说七点,我也不吭声,等他说“见”的时候,我说“见面”,他知道我说的这个词要把那个覆盖掉,再改,再把它改了。这样可能更合理一些,就是你手不用去摸什么东西,眼睛看什么东西,完全能保持你在驾驶的时候,这是我们目前还在进行开发的一个东西,或许下一次如果我们再有机会我们就可以把这个演示一下。

  泡泡网:这样输入就很容易产生一个问题,比如说,他说刘涛,中文姓名里面,刘涛这个名字出现的概率比较多,如果说你的电话中多个人同时叫刘涛,它怎么识别?

  Nuance:这个对于语音识别来讲,它唯一的办法就是把几个刘涛列出来让你选择,这个时候没有别的办法,我知道你说这个,这实际上是我们经常见到的一种情况,只能让用户自己来选择。有时候同样词也会出现这个问题,可以让用户自己选择。然后我再介绍一下关于自然语言理解,这么一个演示。自然语言理解。我想回家。这个就是刚才大家看到那个主页面,就是我们模拟在汽车环境下,你可能做的一些任务,它现在就是这个识别就不是你预定的命令词,如果是让工程师来设计这个命令词,我可能会要求用户说,目的地设为家庭、家里,是这样说,然后用户必须这样说,但是多数时候,当你的命令越来越多,几百个,上千个的时候,人很难记住你的命令词是什么样子。所以我们现在这个演示,能把它叫做自然语言理解是什么意思。就是说我给你定义任务,然后用户用你自己的话,用你自己的词,用你自己的习惯说法,来把这个任务说出来就行了。你想咋说就咋说,我可以打电话给刘涛,我可以说接通刘涛,我可以把刘涛给我接上等等,反正你想怎么说,大概这个意思是把他能连上就行了。这是完全用户主导的。因为你可以想象人的语言是很复杂的,每个人说话跟每个人说话的习惯是不一样的。


  比方说这个关于空调问题,我们过去,空调的命令词是“把空调打开,空调温度提高3度。”现在我也可以这样说,空调调高一点,我有点冷,也可以。就是你在车里边完全可以用你自己的语言来说你想干的事。比如说,前边你不知道明天天气会怎么样,人一般都会想想,明天天气如何,或者是告诉我天气预报。但是你也可以这样说。明天会下雨吗?也可以这样说。或者你这样说,你说,今天大盘怎么样。完全是用自然语言来说。堵不堵车,“查询交通情况。”这就是,实际上可以有各种不同的说法来完成这个任务,这是我们自然语言的一个演示。

  泡泡网:问下以上两个演示已经有实践应用了吗?

  Nuance:现在跟客户推进。

  泡泡网:有没有什么计划,大概什么时候可以在咱们车载上面可以用到?

  Nuance:这个取决于车厂了。而且汽车行业跟手机行业不一样。手机行业我们新东西推出来以后,可能三个月、六个月以后就上市了,汽车行业的东西相对来讲慢一点,他们做东西,做计划,产品进去了以后反复测验,一般都得一两年。

  泡泡网:在中国的车载业务有什么新的进展吗?能否给我们介绍一下。

  Nuance:其实可以这样说,过去一年我们跟不同的供应商都有合作,第一就是导航的供应商,以及一些汽车厂商。在明年大家应该可以看到有国内的汽车会用我们的产品。现在这个实施过程中还在做,刚刚张博士也说过了,关键看这一家汽车公司他们推出的时间会在什么时候,说不定是下年年中,还是下年年底,就看他们的情况,什么时间做。但是我们的合作已经在实施过程里面。所以大家会看到。

  泡泡网:刚才张博士也介绍了这种最新的语音识别技术,我想问一下在语音识别技术这块,相对其他厂商而言我们有哪些主要的竞争优势?

  Nuance:如果是谈到Nuance在语音方面的竞争优势,我们就会感到很自豪。首先它是全球最大的语音技术公司,我们占的语音市场份额,就是语音技术不光用在车里边,包括用在各行各业里边,语音技术,我们在2/3之上,基本上主导了这个语音市场。正因为处在这个位置上,我们对语言的覆盖面是最广的。我们全球只要稍微主要一点的语言,我们基本上都支持,这个是不容易的。因为每做一个语言,公司的投入是非常大的,这是我们的优势。如果回到汽车上边,我们可能最大的优势还是我们的抗噪性更好一些。因为在汽车里边应用语音技术,抗噪性好不好,直接决定了最后你这个系统,就是终端用户会不会接受它,会不会用它的问题。如果说稍微有点噪声,你就老识别错,别人就烦人,或者不会再用它。Nuance在过去几十年里边一直在汽车行业,因为我们现在给你演示的这个引擎,实际上是专门针对汽车开发的,我们相应的还有一些其他的抗噪,减噪的一些算法和一些模块,来帮助处理。从高端到低端的方案我们都有,在欧洲一些高端车上,已经都应用了,抗噪性能好到什么程度?就是你驾驶员在这儿用语音操控你这个机器的时候,副驾驶上坐着人在那儿说话,你这个收音机是打开的,都没什么影响。它就好到这个程度。

  泡泡网:Nuance会考虑支持地方方言吗?

  Nuance:暂时不会支持方言,但普通话带口音是可以的。我们大家都说普通话,我们的识别系统也说普通话,其次要意识到现状,在未来几十年里边,不要指望大家普通话说的都像我这样标准。开玩笑。就说南方人,还会是南方人。所以这是我们的一个努力方向。目前我们的语音识别系统已经尽可能照顾到南北方口音的差异。我可以说目前我们的口音的覆盖面,和我们其他竞争对手里边,我们也是最好的,因为有我们的客户独立做的测试。他做的这个测试很有意思,我们都没有想到他这样测试。本来是测试看你的准确率怎么样,然后看你的准确率在不同的汽车速度下的准确率,我在静止的时候,30公里的时候,60公里的时候,100公里的时候,我的准确率怎么样。一般我们想到他会这样去测。他公司里边的人就是全国各地来的,他把每个人的统计下来,最后我们一看这个曲线,最后他得了一个结论,Nuance这个语音识别系统,目前对语音口音的覆盖还是比较均匀。


  泡泡网:Nuance是怎么看到中国市场的?有没有具体的开拓计划,能否跟我们分享一下?

  Nuance:毫无疑问中国市场非常重要,尤其是汽车市场是全球最大的,而且还以高于全球的增长速度还在继续的增长,所以Nuance肯定是重视这一块的,在过去三年里边,Nuance在中国市场的投入与增长,相比较全球各个区,包括在北美和欧洲,都是增长最快的。我们在中国市场,在三年以前,大概就是几十人,现在已经增长到超过100多个人可见对这个市场的重视程度。在中国、日本、韩国,比利时和德国等都设有研发中心。据了解,奥迪每一年在中国卖掉的车比在整个欧洲卖掉的车还要多,到了这种程度上,所以我们一定会非常重视中国这块市场的。

  这些年我们的一些汽车厂商的大客户,他们也已经意识到中国市场的重要性。他们经常也会跟Nuance谈到,他们在把重心向中国移同时,也建议Nuance也要增加在中国地区的研发力量,来配合我们的工程设计人员在当地的开发,所以后续的发展和在中国的投入将会越来越大。

泡泡网



相关阅读:
Siri技术提供商Nuance收购语音识别公司Vlingo 2011-12-22
四维图新携手Nuance 共创语音导航新时代 2011-12-12
Nuance 推出新NDEV Mobile 移动开发者项目 2011-10-18
合众思壮携手NUANCE引领GPS导航进入新语音时代 2011-10-12
语音识别软件商Nuance以1亿美元收购Swype 2011-10-08

热点专题:  语音合成TTS 语音识别ASR