首页>>厂商>>语音识别与合成>>Nuance

Nuance:车载信息平台迈入语音时代

2010/12/27

  2010年12月8日,Nuance通讯公司全球车载业务部副总裁 Arnd Weil、大中华区总经理郑裕庆和上海研发中心总监张亚昕博士就Nuance车载业务和自然语音技术等方面接受了盖世汽车网的专访。


  从左至右,Nuance通讯公司上海研发中心总监张亚昕、全球车载业务部副总裁Arnd Weil和大中华区总经理郑裕庆。

  盖世汽车网:请介绍一下Nuance车载业务及在中国的发展情况。

  Arnd Weil:简单来讲,Nuance提供移动免提的解决方案,用于打电话、发信息、读信息,通过语音操作来播放音乐、选歌和进行导航。在导航方面,比如用户报出一个地点,我们的产品就可以进行路线搜索。

  车载业务是属于Nuance移动的汽车业务部旗下的一个业务。汽车业务部的产品和服务范围,不单有车内应用方案,还有重点开发互联服务和车载解决方案,将用户介面设计结合连接服务器端车内应用和互联服务。目前前装和后装市场已经分别有超过三千五百万的汽车已经在用Nuance 语音技术。

  Nuance一直跟国际的厂家有合作关系,通过Continental和Bosch等公司进入中国市场。我们的汽车业务在过去10年合作的公司包括福特、戴姆勒、宝马、奥迪、通用、丰田等公司。我们同福特公司从十年前开始在语音技术方面有合作,现在是其语音技术直接供应商和用户界面设计的合作伙伴。

  Nuance对中国市场很重视,去年开始也跟中国本土汽车厂家合作。我们在中国市场建立了专业的团队研发新产品,像上海的语音技术开发中心,除了有本土工程师参与开发过程,全球的专业团队也在开发更适合中国市场的语音解决方案。

  盖世汽车网:Nuance公司有什么竞争的技术上的优势?

  Arnd Weil:Nuance提供非常好的语音用户界面和车用人机界面,支持 30多种语言,无论是车内应用连接终端、服务器终端或联网服务,我们都可以支持。Nuance还可以提供多模式输入技术,包括手写和应用于触摸屏的智能文本输入。

  在语音方面,Nuance 语音技术已经通过很多国家的认证和测试,证明Nuance的识别技术准确率相当高。Nuance能为不同国家的语言提供非常好的支持。这么多年累计下来的经验和成功的案例就是很好的证明。这是其他的竞争对手无法超越的。

  盖世汽车网:Nuance语音识别技术对带口音的普通话的辨识度有多少?

  张亚昕:Nuance从一开始做中文语音识别的时候,就意识到中国面积广大,各种口音繁杂。但是要去做每一个地方方言的语音识别是不太现实的,再加上中国政府一直在鼓励全国推行普通话,所以我们还是争取把普通话识别技术做到更好。所以我们从采集数据阶段就开始着手,从全中国采集声音样本,南到广州、福建,北到黑龙江甚至西北。因此我们的语音识别对各种带口音的普通话的识别率是很高的。

  曾经有客户将我们的引擎拿去和另外一家公司做对比测试,在口音测试方面,我们的竞争对手在不同人的测试上,识别率差异非常大,大部分人可能普通话还比较标准,个别的口音不标准,曲线波动很明显。但是Nuance的测试曲线变化非常小,个人之间的差异非常小,说明我们在口音的覆盖上面做的非常好。

  盖世汽车网:请谈谈语音识别技术研发难点和未来发展趋势。

  张亚昕:我想难点和趋势要一起说,因为难点是我们将来要攻克的,也是我们以后要发展的方向。传统的语音识别都会限定命令词,比如命令里定义“打开空调”,你就只能说“打开空调”,多说、少说一个字,或者换种方式说,它都无法识别。这实际上是对人的限制,用户必须将每个命令词记的非常准确。如果命令词将来定义越来越多,普通用户很难严格记准每一个命令词。

  所以解决方案里面,我们通过语音技术让用户能够很轻松的进行自然且直观的交流与互动。我们只定义任务,不定义命令词,只要你把任务用你自己的表达方式表达出来就能完成。这个叫自然语言理解技术,已应用在北美市场销售的福特汽车上,配合新一代MyFord Touch技术的SYNC系统中实现。

  郑裕庆:其实自然语言处理的难度我们已经攻克。我们有引擎设在呼叫中心,可以实现随便你说什么,都能够做出相应的处理。但是用于车载和手机的引擎是比较小的,一旦压缩,识别率会受到限制。因此怎样进一步提升车载系统的语音识别性能,是我们目前工作的目标之一。

  盖世汽车网:自然语音技术的价格定位在哪个级别?

  郑裕庆:针对高端市场,我们可以提供所谓“ one shot”的解决方案,就是一句话输入,系统会分析你要做什么。这个成本比较高。如果只是打电话或者控制音乐,价格就会便宜很多。所以我们是用不同的功能来定位市场价格。

  盖世汽车网:有不同的市场定位。

  郑裕庆:对。比如通过语音控制手机拨号在低端车里面也可以实现,价格会相对较低。但是有一些汽车包含控制整个系统,包括空调,音乐,导航,再加上云端的服务,价格就比较高,当然这些只在高端车里面出现。因为其实你要做这么多东西,除了我们的软件技术价格会高以外,其他的东西好像内存、CPU,整个硬件配置也会相应提高。

  盖世汽车网:就Nuance目前的业务来看,语音、文字智能输入和图象解决方案,三大块业务的比重各占多少?

  郑裕庆: 语音的业务是最核心的,占到85%。你可以看到我们覆盖到手机、汽车,我们现在可以做到的就是电子书、电脑。接下来我们要做IPTV,交互式网络电视。还有在呼叫中心和医疗,都做得很大。医疗方面是用语音来输入那些病人的病例并存档。因此语音是Nuance最主要的一个业务。

  盖世汽车网:Nuance在中国推广车载语音系统产品时采取了怎样的市场策略?

  郑裕庆:中国用户追求物美价廉,因此我们在他们提供的条件下调整策略,在中国实施比较灵活的价格策略,根据市场需求去定价。在支持服务方面我们会选择一些比较好的厂家,投入我们的人力、时间同他们一起去按照他们的需求开发相应产品,以保证产品出来以后有高质量和非常高的客户满意度。

  盖世汽车网:Nuance最近在中国进行了用户对车载语音应用的调研,可否分享其中一些调查结果。

  张亚昕:我们最近在中国做了一个汽车GPS用户调研,几百位中国的汽车驾驶者参与了我们的调研,主要围绕车内是否装有语音系统和使用频率等问题。接近30%的车内有语音控制功能,它超出了我的预想。实际上很多人都对语音控制、语音拨号感兴趣。比如空调升高两度,收音机调到97.7Hz,或者是打电话给张三,这种命令他们非常感兴趣。

  盖世汽车网:这个应该在您意料之中的吧?

  张亚昕:这个是在我意料之中的,但是有一件事情在我意料之外。43.5%接受调研的人会一边开车一边发短信,这是非常危险的事。其中的15.5%是一边行车一边发短信,还有28%的人表示在等红灯的时候发短信,但是你可以想象如果变成绿灯,他们会继续把没有发完,很不安全。

  郑裕庆:所以很多时间我在等红绿灯,前面的车等到了绿灯还没有走,很有可能是在发短信或者打电话。

  张亚昕:国外很多国家已经颁布法令,严格要求开车期间不许打手机,不允许发短信,但是在中国有这么多人边开车,边发短信,是不可想象的事情。

  还有一个问题出乎我意料之外的。车载语音识别因为车内环境特殊,噪音比较大,识别率会偏低,效果不如安静环境下,但依然有82.3%的人认为它是合格的。

  郑裕庆:现时应用车载语音识技术基本上都是高端车。因为我也知道国内有些厂家在低端车上配置语音识别,效果很不好。其实是没有达到这个标准。现在一些用户同我们合作,就是因为以前有用一些国内的技术,然后发觉真的不行了,再找我们重新做。其实门槛是比较高的,过不了这个门槛无法满足用户最终需求。比如福特在美国,打广告是卖它的语音控制系统。通过改变用户体验,坐上来觉得安全的同时还能更加有卖点。我相信今后国内很多车企也会朝这个方向走。
共 2 页:1 2 

盖世汽车网



相关阅读:
Nuance杨文弘专访:滑行输入法将成主流 2010-12-22
Nuance新推“龙游戏语音包” 语音识别操作游戏 2010-12-10
Nuance进军中国语音识别市场 2010-10-25
NUANCE T9 Trace中文滑行输入发布 2010-10-14
Nuance:语音识别技术引领呼叫中心全新客户体验 2010-09-30

热点专题:  语音合成TTS 语音识别ASR