首页 > 技术 > 技术文摘 > 不仅是技术—语音门户专题系列(一)

不仅是技术—语音门户专题系列(一)

2002-01-25 00:00:00   作者:   来源:   评论:0 点击:881


 

  编者按:基于语音识别和合成技术的语音门户近来被炒得沸沸扬扬。语音门户不仅仅是新的技术,而已经是成熟的产品,只不过还没有被真正引入国内。目前,能够用于语音门户的语音识别核心技术基本上掌握在以下几家公司手里:PHILIPS、Nuance、IBM、SpeechWorks和InfoTalk。尽管这些公司都有实际应用的案例,但其技术不一定都能应用于语音门户。

  语音门户在中国的推广,核心问题不是在技术上,而是在应用开发和服务上。限于设计、建设和运营中文语音门户经验的欠缺,许多应用开发商(ASP)和核心技术开发商还只是在向用户推荐技术和概念。但如果这些方案并不具备商业操作价值,不能在语音门户的运营上创造价值,也就没有任何应用价值。

  本专题将以系列报道的形式连续、全面地介绍语音门户,澄清一些误解,并探讨如何在中国建设语音门户。

语音门户介绍

  语音门户(Voice Portal)是沟通电信用户、电信网络及其他信息系统的桥梁,它是一种产品,而不是一种技术。语音门户的主要特点包括:

  • 为固定和移动通信用户和运营商提供服务;

  • 一个号码接入: 用户拨入一个特服号码,享受全部服务;

  • 以自动语音识别(ASR)提供导航和服务;

  • 提供个性化和人性化综合服务和统一消息服务。

   具体地说,语音门户应该是建立在电信运营商的电信网络上,为客户提供个性化和人性化的客户服务、信息服务、转接服务和个人定制服务的平台。在这个平台上,用户通过语音界面,可以更快捷、更方便地获得比传统IVR系统更丰富的信息和更完善的服务。

成功案例

  从20世纪90年代末以来,随着语音技术的成熟和逐步实用化,由于计算机硬件性能的飞速提高,语音门户开始在世界发达国家出现。特别是在欧洲和美洲,较高的用户消费水平能够消化吸收较昂贵的新技术,语音技术开始进入客户服务和信息服务领域,并逐渐与互联网融合在一起,为客户提供个性化和人性化的服务。目前,国际上比较成功的案例有:

  • Vodafone:综合信息系统,提供个性化统一消息服务。

  • Mannesmann Arcor:在德国推出了Talking Web。这项创新技术使语音入口的内容不再必须从指定数据库中检索,而可以直接从Web服务器上访问。

  • Omnitel:1999年5月开通,电信增值服务平台。提供财经、生活、娱乐等各种信息服务和转接服务。

  • 台湾和信电讯Ms.600:2000年8月开通,移动通信增值服务平台。提供信息服务、转接服务、统一消息服务。(详细资料请参考http://www.kgt .com.tw/sitemap/qminfo_08.html)

澄清一些概念

  (1)VoiceXML不是语音门户标准

  经常有人把VoiceXML说成语音门户的标准。实际上,在VoiceXML出现之前,语音门户就存在了。VoiceXML不是语音门户的标准,只是用于解决互联网与语音界面的接口问题。VoiceXML目前还存在一些问题,主要表现在:

  • VoiceXML的标准还在制订和完善过程中;

  • 目前还没有解决双向的问题,只有提问,没有回答,只能下载Web page;

  • 目前世界上大部分网站用的都是HTML或WML标识语言,如果要求所有的网站都支持VXML的标识语言,还有相当的距离。

   目前,计算机硬件、操作系统、电信、网络和语音识别的主导厂商正在起草一个新的语音处理标准—语音应用语言标识(SALT,Speech Application Language Tags),它能够兼容HTML、xHTML和XML。参与制订这一新标准的厂商有:Cisco、Intel、Microsoft、Phillips和SpeechWorks等。详细信息请参考其网站:www.saltforum.org。因此,VoiceXML的前途如何,还有很大的疑问。

  (2)不同领域的语音识别技术

  并非所有的语音识别技术都能应用于语音门户。语音识别技术可以分为3种:

  • 个人终端设备上的技术——以固化语音模块形式嵌入PDA、手机、玩具、家用电器等产品。其特点是:简单功能,小词汇量、针对特定用户(需要用户事先训练机器才能听懂)。目前也有一些更小词汇量的,针对非特定用户的产品。

  • 基于PC的技术——语音指令控制PC动作、听写录入。支持大词汇量、针对特定用户,使用前必须训练,要求安静的使用环境。

  • 基于电信网络的技术——应用于电信网络中,提供大词汇量识别、与用户无关。这个领域中的语音识别系统,由于受到语音传输频宽、环境噪声、系统回声、电磁干扰、不允许实现训练等更加苛刻的约束,对技术的要求就更高。

  之所以要区分这三种技术,是因为这三种技术应用于不同的领域,其技术结构有非常大的差别。一个领域的产品,转化为另一领域的产品是十分困难的。用户在选择语音识别技术的时候,要看其专长在哪个领域。

  (3)语音门户不是语音网站

  一提到语音门户,总有人把他说成语音门户网站。实际上,语音网站仅仅是语音门户的一个很小的部分。如前所述,语音门户集成了电信网络、计算机网络和互联网,提供统一消息服务,远比语音网站丰富和强大。

核心技术与流程设计 语音门户的两扇门

相关阅读:

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

分享到:   收藏

专题