首页>>厂商>>语音识别与合成>>Nuance

3G时代语音识别成本仍然是“拦路虎”

2009/06/10

  “跑遍了京城的儿童玩具市场,竟然找不到几款能够顺利完成语音对话的玩具娃娃”,这是六一前夕记者遭遇到的尴尬。无独有偶,此前中科院自动化所以31万元的价格,为四川科技馆定做的能根据人类语音命令来完成画像的特种机器人“贝奇”,可惜只是展示和娱乐观众。

  中国已经进入了3G元年,整个通信产业以高速度前进,儿童玩具市场作为全球最大的消费市场,其语音技术应用如此稀缺,产业链的企业是不是该反思反思。根据记者调查,目前最大的问题还是投入过高,回报甚微。

  郑裕庆

  “一直以来,语音控制模块的成本因素似乎都是阻碍语音识别技术接近普通消费者的“拦路虎。”Nuance大中华区总经理郑裕庆告诉《通信产业报》(网)记者。

  Nuance全球寻找突破口

  郑裕庆对《通信产业报》(网)记者表示,“早在三年前我们已经和索尼公司合作,进军到了儿童电子玩具市场。由于儿童玩具语音对话功能涉及到产业链的数个企业,而且成本较高,因此,目前这个市场处于雏形阶段,今后开发前景大有可为”。

  Nuance移动-企业事业部及消费者服务事业部总裁史蒂夫·钱伯斯告诉《通信产业报》(网)记者,语音识别技术在世界上许多国家都有其应用,目前,全球超过2/3的财富100强企业采用了Nuance的解决方案,超过2.5亿台设备内置了Nuance移动语音处理设备。

史蒂夫·钱伯斯

  在通信领域,包括AT&T、Verizon、LG电子、诺基亚、摩托罗拉,在终端上都载入了语音识别的技术,在航空方面应也比较广泛。如今,包括美国航空公司在内全球多家航空公司采用了语音识别系统软件。

  业内人士分析,语音识别技术有两个方向:一是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的方向是小型化、便携式语音产品的应用,如手机拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现。近几年来迅速发展的语音信号处理专用芯片和语音识别片上系统的出现,为语音识别的广泛应用创造了有利的条件。

  中国市场方兴未艾

  目前,语音识别技术在中国金融系统应用曙光初现。

  “语音软件目前应用属于初级阶段。主要是大多是手机银行和电话银行根据用户的声音辨别真伪。估计今后可能拓展到更宽泛的领域”。中国建设银行数据服务中心的负责人表示,语音软件在身份认证、账单支付、个人数据修复等应用效果明显。

  目前,通过语音识别技术在中国移动增值业务上有所突破。此前,江苏移动、山东移动等电信运营商,已经实现了用户通过“哼”一段旋律,就能查找到自己听过却不知道名称的歌曲或彩铃,并且进行点播和下载的新业务。
  
  “这种大规模的商业应用,已经进入了成熟阶段。”中科院声学所语音实验室有关人士表示,在商业应用上,这套系统最关键的部分是解决了计费环节的问题,电信运营商和声学所,由此可以按照每条查询的下载量来进行按比例分账。

  “中国拥有超过近8亿移动用户,占全球最大的流动电话市场。”钱伯斯对中国的3G市场充满了期待。据其透露,Nuance目前已和包括中国银行在内六家银行达成了协议,未来语音系统将全面发力中国市场。 

  语音识别技术壁垒犹存

  据媒体报道,2006年,中国电信推出的号码百事通新业务,就是一款整合用户号码信息的基础上,针对用户的模糊查询等信息服务需求提供的新产品。可惜的是模糊查询,效果不佳,现行的“号码百事通”业务还需要靠人工接线来实现,这必然需要投入大量资金来建设和不断完善呼叫中心。

  钱伯斯表示,今后将加大中国市场的开拓力度和在中国的投入,今年Nuance中国的员工将增加一倍,并加大研发力度,提高中国语言识别的准确率。

  目前,国际上Google和微软在语音识别技术上竞争激烈。世界上只有少数几家公司能够形成核心技术,而中科院声学所是国内唯一完全拥有核心自主技术的单位,目前其最大的竞争对手主要是美国的Nuance公司。

  在金融危机仍笼罩全球之时,恰逢中国3G元年,语音识别技术的应用将是一个千载难逢的机会。但是,突破这个壁垒也需要一个长期的过程。

通信产业网