首页 > 新闻 > 专家观点 >

Nuance获“声控导航产品优秀成果奖"

2013-06-06 09:53:32   作者:孙其   来源: 新华网    评论:0  点击:


 Nuance获“声控导航产品优秀成果奖"
Nuance通讯公司大中华区总经理郑裕庆先生(Daniel Cheng)

 Nuance获“声控导航产品优秀成果奖"
Nuance通讯公司上海研发中心总监张亚昕博士(Yaxin Zhang )

  5月15日,由工业和信息化部指导,人民邮电报社主办、中国信息产业网承办的第三届 “车联网”产业链合作研讨会于北京召开。Nuance公司在会上获得“声控导航产品优秀成果奖”荣誉,并接受了新华网专访。

  接受访问的两位嘉宾分别为Nuance通讯公司大中华区总经理郑裕庆 (Daniel Cheng)和Nuance通讯公司上海研发中心总监张亚昕博士 (Yaxin Zhang )。

  关于Nuance公司的基本业务情况,郑裕庆先生做了简要的介绍。

  郑裕庆先生:

  Nuance是家全球领先的语音和语言解决方案提供商,为世界各地的企业和消费者提供服务。我们的语音解决方案支持50多种语言,超过80种语言输入。对于需要拓展全球业务的企业来说, Nuance是最佳的选择。

  关键词:在华业务

  2008年在中国建立了研发中心,由张博士负责管理研发团队。主要针对中国客户本地化方案开发,目前在北京和上海都设有技术支持及售后服务(Professional Services)队伍和研发中心,北京队伍主要负责文字输入的售后服务,上海队伍主要负责语音方面的技术支持,以及用户界面、语音合成引擎及其他模块的研发工作。另外,香港和台湾也设有销售人员和服务团队,可以给我们的客户提供服务。我们在中国的业务包括:一是给企业呼叫中心提供解决方案,包括银行、电信、金融等公司的呼叫中心,为其提升自助客户服务体验。另一个是移动设备,包括手机、PC等,还有电视、空调等家电。另外,汽车及导航厂商提供移动解决方案现在我们已经和一些国内厂家在合作,将来会陆陆续续看到我们的成果。现时中兴Grand Memo智能手机提供的车载模式应用,便是使用Nuance的语音技术,你在开车的时候可以通过语音控制你的手机去拨电话或者听音乐。新款的 HTC One汽车模式应用也整合了 Nuance 语音技术。 还有,三星Galaxy S4的S Voice Assistant,也是使用Nuance 的语音技术。

  关键词:Nuance与“车联网”

  在汽车应用方面,我们跟国内本土车厂有比较紧密的接触。比如比亚迪最近出了一款车叫做思锐,其车载系统就整合了 Nuance的车载语音识别技术,通过语音控制命令可以实现对电台、碟片、空调系统等进行控制,而且支持普通话指令,给驾驶者带来更智能、更安全的车载体验。Nuance 的车载解决方案包括嵌入式和互联解决方案,嵌入式方案不需要网络连接可以提供最基本功能如拨电话、听音乐、调空调、收音机转台等等。而通过远程云端,能让用户借助自然语音命令与车载系统实现互动,并从移动互联网轻松获得所需内容,比如附近的电影院在播什么电影、交通状况怎么样,这些可以在云端实时更新。

  过去十多年里,Nuance 一直在推动着汽车市场的创新发展。其车载解决方案涵盖了语音识别、语音合成、信号增强和预测文本输入等技术,提供了当今最先进的车内导航系统、娱乐和车辆通讯系统的用户交互界面,能显著提高驾驶安全性。驾驶者在驾车时就能通过语音指令安全地与外界保持联系,操控导航系统、汽车信息娱乐系统等车载系统和设备,最大程度避免了手动操作导致失误和分神,从而释放双手和眼睛,为驾驶者提供了更加安全和更为直观的“互联汽车”体验。

  关于Nuance语音识别技术的精度问题,一直是用户和广大消费者关心的问题。就这一问题,张亚昕博士进行了详尽的解释。


  张亚昕博士:

  这个问题也是目前很多客户关心的事情,通常我们去介绍语音技术的时候都会被问到,所以刚才的演讲当中也专门提到这个话题,就是如何解决一种目的、多种表达方式的问题,如何解决中国分布这么广泛、这么复杂的方言和口音的问题,这确实是语音识别的难点。还有刚才提到的精度,语音识别精度比较复杂,因为语音识别的精度跟太多的因素有关系了,不能泛泛地说,给你一个语音识别器,自己在那里念一百条句子看看对了多少条,就说识别精度到了多少,这绝对是不科学的。首先它应该是一个统计的结果,其次应该是在一个实际使用环境下的统计结果。

  比如车载环境下的语音识别,这个测试一定要在车载环境下去测试,。现在我可以拿数据来佐证,我的系统就可以达到99%,但是实际应用测下来可能就是80%,因为我可以针对性采集语音数据,发音很标准,说的所有东西跟我的设计是严丝合缝地匹配,这样识别率会非常非常高,所以单独谈这个东西是没有意义的。首先是一个接受环境的问题,而且语音识别真正做到产品以后,不光是语音识别引擎可以达到百分之多少,还有UI设计好不好的问题。

  谈到意义和目的、多种表达方式的问题。我们目前在积极推动自然语言理解技术。如果我们退到五年以前,语音识别可能就是,我设计了一个语音识别,所有的命令都按照设计程式设计好了以后就放在系统里面。我的测试可以达到98%的准确率,用户使用呢?我说的东西和你设计的词不一样,便无法准确识别。我们现在就要引入自然语言技术,就是在我的语音识别基础上再加一个模板,这个模板叫做自然语言理解。引入自然语言理解技术后,人们不再是用特定的指令,例如:你想拨打张三的手机,只要说拨打张三的电话就能帮你进行操作。先把你说的一句话中关键词提出来以后,看你的目的是什么,然后再找这个目的,找到目的以后再把关键词里的东西朝着目去靠,最后发现你是想拨打张三的手机,这个任务才能完成。

  每个人常用的词不一样,每个人表达方式和语法结构也不一样,整个自然语言理解模块需要处理的问题确实比较多,难度也很大。我们要做到完全跟人脑一样,现在的科学技术和目前的系统资源实际上是做不到的。好在我们在车里的出现的应用场景是有限的,无非就是定义10-20种应用场景,这样需要的句法就有限了,机器资源就可以处理了,而且精度也会比较高。

  现在这个技术已经相对成熟,已经到了应用阶段。用户基本可以得到一个比较满意的结果。

  谈到Nuance最近与全球领先的导航地图公司高德开展商业合作,体现了那些战略要点,郑裕庆先生进行了深度的解读。


  郑裕庆先生:

  我们已经跟国内两家导航地图和信息服务提供商有合作,分别是高德和四维图新。我们跟他们合作共同开发语音导航地图产品。助力汽车厂商和导航设备提供商迅速革新中国语音导航市场新体验,为中国车载导航用户带来更加安全、更加智能的驾车新体验。


  关于汽车内运用的语音技术和其它场景有什么不同,怎样解决行车过程中的噪音干扰问题,张亚昕博士也做了专业的介绍。


  张亚昕博士:

  抗噪性是车里首先需要解决的问题,抗噪性的硬件配置既可以便宜也可以贵。比如,我们在抗噪性处理方面,初级方案里在算法中会增加一些抗噪模块,再进一步比如增加定向性好的麦克风进行处理,再进一步我们就有比较完整的解决方案Microphone array and beam-forming ,一些在欧洲的高端车比如戴姆勒奔驰中已经有所应用。其应用原理是,在语音识别系统中装若干个麦克风,通过配套的数字信号处理模块,来进行定向的交叉,从而更好地将声源控制在驾驶员脑袋周围附近,这样会非常大幅度地抑制周围噪音带来的干扰。这其中起到关键因素还有一个SSE技术,配备Microphone array 软硬件共同处理,极大提高抗噪性,而且能够屏蔽掉声源里的噪音干扰。SSE技术部分解决了相对远距离(只要麦克风超过30厘米)的问题, 实际上在汽车中目前也存在这个距离,一般汽车的语音识别器安装在倒视镜位置,距离驾驶员也有30-50厘米。SSE技术相应地能够更好地降低这部分距离的干扰。

  宝马的7系列在去年的第一季度首先发布全球第一个应用Nuance的Dragon Drive!Messaging语音短信服务,这个应用在全世界的车里它是第一家,可以一边开车一边通过语音发短信、编写e-Mail和文本信息。基础识别率高除了引擎好还要在硬件上配合,通过麦克风的阵列配合接收声音,这样就把噪声都抗掉了,但是成本也高起来了。


  最后,就大家比较关心的行业发展问题,郑裕庆先生也给出了自己的判断和建议。


  郑裕庆先生:

  我们接触的厂家比较多的,所以我们会汲取客户的一些反馈和意见。Nuance以技术和服务质量为先,为我们的客户提供最好的技术服务,通过我们的语音技术提升消费者满意度,为客户带来更多的市场份额。现在的市场就是“一窝蜂”,很多人觉得语音是一个很热的话题,他们也要去做语音产品,但是很多情况下他们的产品只是实验室里的试验品。Nuance公司在这方面,我们是可以做才去做,我不可以的就说不可以。

  Nuance拥有领先的语音技术,强大的研发团队、丰富的经验和无数的成功案例。在车载业务方面,我们开发的革命性语音产品和技术令驾驶者,仅借助语音命令就能和广泛的车载系统和设备互动,为驾驶者提供了极大的便捷和提升了驾驶安全。我们会坚持通过我们强大研发团队,结合本土化的研发及提供优质的服务,继续推动汽车市场的创新发展,为中国消费者带来更直观的互联汽车体验。

相关阅读:

分享到: 收藏

专题