Nuance语音:让对面的“它”更善解人意

2012-12-24 08:59:27   作者:曹建菊   来源:CTI论坛   评论:0  点击:


  第一次面对面采访Nuance通讯公司大中华区总经理郑裕庆先生是在2010年的9月,当时是参加Nuance在北京举办的企业论坛。

  再次见到郑裕庆先生则是在2012年初冬的一个有风的午后,位于三元桥附近的Nuance北京办公室, 简洁的设计结合Nuance 绿色标志,阳光斜射在会议室中侃侃而谈的郑裕庆先生脸上,这是一张有着温和微笑的脸,也是写满了自信的脸。回首这两年Nuance通讯公司在大中华区的业绩,就足以记载了他这3年多来带领Nuance团队所做的努力。
\
上图为:Nuance通讯公司大中华区总经理郑裕庆  (Daniel Cheng)
 
  自然语言理解技术

  CTI论坛记者:语音的应用,最为广泛的就是语音合成及语音识别。Nuance最近总谈到自然语言理解技术,何为自然语言理解技术?

  郑裕庆:Nuance自然语言理解技术是基于语音识别技术研发的针对人类语义理解的更加智能的语音技术,围绕一些命令来做。以前的语音技术水平达不到语义理解,比如语音对话:“今天我应该穿长袖还是短袖?”传统的语音识别技术引擎是处理不了的,要么不能识别,要么只是播报一下天气预报,Nuance自然语言理解技术引擎能告知今天是什么温度,天气很热,适合短袖着装,因而能更加深入的理解复杂的问题,明确理解问题的目的。
 
  CTI论坛记者:自然语言理解技术的技术原理是什么?如何实现?有哪些特点及优势?

  郑裕庆:实际上,自然语言处理,实现人机自然语言通信,或实现自然语言理解和自然语言生成是十分困难的。造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的歧义性或多义性,因此,自然语言的形式与其意义之间是一种多对多的关系,这也正是自然语言的魅力所在。
 
  CTI论坛记者:自然语言理解技术的主要应用表现在哪些方面?

  郑裕庆:我们委托Vocal Laboratories Inc. (Vocalabs) 进行的一项最新调查显示,三分之二的消费者在使用客户服务咨询时更倾向于使用自助服务,而非与坐席交谈。
\
  该调查也指出,便利是最重要的影响因素。75%的消费者认为自助服务更方便,相比之下,只有6%的人认为与坐席交谈的方式是最方便的。

  我们在国内有一家银行的案例,以前客户不知道该如何使用语音导航,发现最终用户的电话总是被转错,因为语音导航并不是简单的代替按键。

  Nuance会根据客户的最终用户来设计方案,最终用户只需要用语言来表达自己所需要的服务,需不是让用户来记住这个业务叫什么名字。比如在办理银行业务时,你可以直接用语音表达:“我要转3000块钱”或者说:“我要从储蓄卡账户转到我信用卡账户”,而不需要让最终用户记住银行的这个业务的标准名称叫“转账”。

  所以,自然语言理解技术在应用方面的拓展性是比较强的,银行、保险、电信、移动互联网等领域都能广泛应用,此外,语音应用已成功引入数字客厅,领先的智能电视生产商如LG、松下和三星今年先后就已推出了使用Nuance语音识别技术的智能电视设备。
 
  语音与移动互联网

  CTI论坛记者: Nuance也推出了Android版语音助手,有媒体说是在正面对抗Siri,同属于移动终端的应用,这样的策略对Nuance意味着什么?

  郑裕庆:Nuance是一家提供语音和语言技术的厂商,可以为客户提供语音方案或订制服务,我们都是期望能带给大家语音方面的便捷。
 
  CTI论坛记者:当然,也有一些用户反映市场上语音应用的识别率不是特别高,在本土化方面,Nuance会如何部署去迎合中国用户的习惯?

  郑裕庆:Nuance为了顺应中国大陆地区用户的习惯,在中国设有自己的研发中心和服务团队。采集了南到广州,福建,北到黑龙江,甚至西北等全国的语音数据,使得Nuance在识别即便带口音的普通话时,也具有非常高水准的识别率。同时,开发、销售及服务的本土化,也有助于进一步降低成本,加速Nuance语音识别技术在中国市场的推进步伐。

  以前Nuance的语音引擎搜索是在国外的团队负责开发的的,比如美国的地址一般是哪一个区、哪一个街道、哪一个门牌号,而上海的地址则习惯于写某条街与某条街的交汇处,直接写大厦名称等,另外,中国还习惯写简称,比如上海交通大学简称交大。这些本土化应用以前是没有的,现在国内的应用都已经开发完成。
 
  CTI论坛记者:语音应用于移动互联网最需要解决的难题是接口还存在很大限制,这方面Nuance有没有什么样的改进计划?

  郑裕庆:Nuance目前在移动互联网领域的接口几乎没有很大的限制,我们都有预留接口,这对我们不存在困难。

  云端加嵌入式
 
  CTI论坛记者:我看到Nuance最新推出了的一种混合性的解决方案,云端加嵌入式,具体方案背景是什么?

  郑裕庆:云端加嵌入式的解决方案,让本地可以处理的问题就在本地处理,而不需要放在云端,比如电视的语音应用,开关机就可以安装在本地,其它应用放在云端。

  另一方面,手机和汽车的语音技术嵌入式应用也比较广泛,在欧美市场,福特汽车一直采用Nuance的语音识别技术。在中国市场,新福克斯采用的第一代SYNC系统也是采用了Nuance的语音识别技术。另外,奥迪、宝马、奔驰、丰田等都是Nuance的客户,在不远的将来也会有配备语音识别的新车型上市。

  Nuance结合嵌入式和云端的解决方案,其优点是在用户体验和效果方面。现在所有的国内厂家都是在做基于云端的解决方案,但Nuance提供的就是结合嵌入式和云端的解决方案。这样,很多本地功能都可以实现,不需要靠云端去做。无需通过网络也能提供的服务。
 
  CTI论坛记者:语音技术最怕的噪音如何处理?

  郑裕庆:Nuance 的语音解决方案拥有良好的抗噪性,并有业界认可的Benchmark进行测试,其中国内公司跟Nuance最没法比的就是远距离的语音识别。Nuance提供的语音技术的抗噪性可算是领先全球,我们有一个团队专门针对这方面提供解决方案,目前已有十二年的经验积累。在家电、电视机、汽车上应用语音技术,抗噪性的好坏会直接影响终端用户对它的接受性和用户体验,所以是非常关键的。怎么去处理噪音,同时保持高识别率是非常困难的。

  以汽车为例,在一个房间里面或是停着车,开着30公里、100公里、开窗、开雨刷、人的叫声、开着音乐,这都是完全不同的环境。所以有一些我们的竞争对手,说自己的语音识别还不错,但是测试都只是在一个特定环境里做,但一旦到了一个完全不统一的环境,他们的东西就变得用不了。

  中国是比较新的市场,很多人不知道怎么去测试语音的功能。在测试方面,我们也在教育我们的那些客户如何做测试才是标准,才可以跟其他的去比哪个技术比较好。如果没有一个方法论,就没办法进行类比。

  有一些国内的竞争对手,一方面价格便宜,另一方面先帮你做完才收费,但后来发觉免费也不是好事,用户体验不好,车的品牌都受到影响。现在慢慢再教育这个行业,但是高端的汽车或真的很好的品牌,他们测试是很严格的,之后才去选择,这才是最好的方法。

  从技术本身来说,Nuance有一种独有的算法,专门把风噪声降下来,比如在车里,如果打开车窗,主要噪声来源是风噪声,如果在屏幕上看波形,实际上语音的波形被噪声完全淹没了,但是我们有一个很好的算法可以把风噪声去除。

  另外,还有其他像脉冲做成的这种声音,我们也有专门的算法。此外,另一种是针对扬声器的播出声音,扬声器操作会发出声音,甚至有时候就是语音对话,语音界面系统的提示音会告诉你干什么,但你不需等提示音结束便可说话,等于两种声音一块进去,但是它就可以把扬声器的声音屏蔽掉,光把你的声音录进去做识别,这个技术叫回声消除(Echo Cancellation)。

  汽车抗噪技术最难处理的是副驾驶和后排坐的人也在那里说话,这些声音一块进来最难处理,但是我们也有这个技术,英文叫Beanforming,用中文说就相当于定向,提取正常驾驶员位置上的声音来源,其他的地方屏蔽掉。在抗噪技术方面,针对不同噪声我们有不同的处理办法。

  抗噪性不光在汽车里,在其他应用领域里也有。最常见的是语音控制电视。Nuance解决方案是:人坐在沙发上,可以通过语音控制电视,其他厂家用的解决方案还得把声音先关掉然后再说,这样来回折腾十分麻烦。而我们这电视声音照样播,而我发的声音是我发的,而且坐得老远就可以这么说着,这运用了以上介绍的几种技术,一个是回声消除,电视出来的声音会自动屏蔽掉,只有我说的命令能进去,这是其一。第二,沙发上坐了好几个人,我是发命令的人,别人说话它听不见。
 
  免费语音不会长久
 
  CTI论坛记者:Nuance进入中国市场已有一段时间,目前市场状况如何?主要客户分布情况?

  郑裕庆:我们的客户主要在银行、汽车、电信、保险、政府等行业,另外,IPTV、移动应用开发也是我们发展的重点,相比较而言,传统呼叫中心语音技术能实现更好的用户体验,市场潜力较大,同时,客户相对比较谨慎。

  Nuance在中国的市场开拓非常好,目前每年以50%左右的速度在递增。
 
  CTI论坛记者:Nuance的主要销售策略是什么?您怎么看待目前的语音市场?2013年有哪些规划?

  郑裕庆:Nuance的主要销售有直销及渠道销售,我们在汽车导航等领域采用直销方式,同时,Nuance主要还与合作伙伴合作,我们目前的合作伙伴有Avaya、华为、亿迅、宝东等,我们期待着与各伙伴进行紧密而有成效的合作。

  语音市场目前看起来很火,你会发现隔一段时间就会有一些新的语音公司冒出来,尝试着去做一些语音的开发应用,我预计2~3年之后会有一些企业整合或者倒闭,市场会有调整。

  另外,便宜的、免费的语音肯定不会长久,因为没有后续的支持力度。

  Nuance会对目前的语音方案进行优化,我们有信心帮助本地客户更快融入国际市场,因为我们有30多种语言做支撑。
 
  郑裕庆个人介绍:

  郑裕庆先生自2008年起担任Nuance通讯公司大中华区总经理,执掌Nuance在该区域的企业级市场及嵌入式方案业务,并负责拓展该区快速增长的客户群。

  长驻北京的郑裕庆先生在IT行业从业近20年,对亚洲及大中华区市场有着深刻的了解。同时,他在业务拓展、运营管理、产品布局、客户服务以及针对不同市场的销售推广等方面也都拥有丰富的经验。因此可以相信,郑裕庆先生将会把Nuance 先进的语音与文字输入技术以及完善的服务带给客户,从而帮助大中华区的本地及海外企业从容应对全球化挑战。

  加盟Nuance之前,郑裕庆先生曾任Business Objects大中华区的董事经理,不仅为其营运模式及策略注入新思维,并使Business Objects销售盈利能力及运营水平取得了明显的进步,在市场上屡创佳绩。

  1997年,郑裕庆先生加入赛门铁克 (Symantec)并就职九年,担任其中国公司董事经理及大中华区客户与SMB解决方案的董事。另外,郑裕庆先生还在Borland出任过亚太区产品市场经理及该公司在印度和泰国的经理,因而拥有丰富的区域性管理经验。

  郑裕庆先生毕业于英国Essex大学计算机系人工智能专业,获硕士学位,他还同时拥有NewCastle大学航海及造船专业的学士学位。

  声明:CTI论坛(CTiforum)版权作品,未经CTiforum书面授权,严禁转载,违者将被追究法律责任。

相关热词搜索: Nuance 语音识别

上一篇:深层次客户化应用才是硬道理

下一篇:最后一页

分享到: 收藏

专题