首页   新闻  文摘   行业   产品  技术  厂商  标准  BBS  导航  搜索
呼叫中心 | CRM | 统一通信 | 企业通信 | VoIP | 视像通讯 | 语音应用 | 热点专题

首页>>厂商>>语音识别与合成>> 北京无限商机

语音系统开发的新平台:VoiceXML浏览器

张欣 2001/10/19

VoiceXML将语音交互引入了数据浏览的世界,使电话等以语音为主要形式的设备成为新型的网络终端,其自然、简单,具备了更为广泛的普及性和友好性。本文对无限商机公司的VoiceXML语音浏览器的介绍,将帮助读者进一步了解它的功能和用途。

无限商机公司的VoiceXML语音浏览器是为解决用户的多种需求而设计的,在实现过程中,分别设计了控制层、安全层、事务层、会话层和应用层,并开放了除控制层之外的所有层的接口。

1.VoiceXML语音浏览器的组成部分

一个完整的VoiceXML语音浏览器,由VoiceXML 解析器、语音识别引擎、语音合成引擎、语音通道等几个部分组成。

(1)VoiceXML 解析器

VoiceXML解析器是整个语音浏览器的核心部分,在语音浏览器中担负控制中心的角色。VoiceXML解析器通过网络协议,如HTTP协议等,获取VoiceXML 脚本语言所描述的应用文档;解析该应用文档,解释其中各个标志,生成相应的控制命令,控制其他部件进行相应的动作,并获取结果;根据结果决定应用的执行方向和顺序流。

(2)语音识别引擎

语音识别引擎是VoiceXML语音浏览器的生命力所在,它使计算机能理解用户的语音命令,将产生的相应的文字结果送回VoiceXML解析器进行处理。

在VoiceXML语音浏览器中,语音识别引擎为命令式的识别引擎,其根据有限的语法来识别用户的语音信号,产生对应语法定义的识别结果。所以,语法便成为了VoiceXML语音浏览器中的重要概念。在VoiceXML语音浏览器中,语法决定了用户能说什么、如何说。好的语法能带给用户良好的交互感觉,也能从逻辑上提高语音识别引擎的识别率,使整个语音应用的浏览流畅而轻松。

在VoiceXML语音浏览器中,语音识别引擎不仅需要处理对用户语音信号的识别,同时也需要处理对用户按键的识别,按键和语音以同样的机制被处理和传递。

(3)语音合成引擎

VoiceXML语音合成引擎可以将文字转换成语音文件,也可以转换成语音数据流,或者直接将事先录制好的语音文件直接播放或以流的方式播放给语音通道。

语音合成引擎将文字转化为声音的品质,决定了用户对系统的直接感觉。因此,如何提高语音合成引擎的合成品质,已成为影响语音应用效果的重要因素。

(4)语音通道

语音通道是在VoiceXML语音浏览器中传输用户语音数据信号和由合成引擎所产生的声音数据信号的传递通道,它在物理上连接语音采集和播放设备、语音识别引擎的语音输入端和语音合成引擎的语音输出端。

在基于电信平台的语音应用系统中,语音通道的物理设备主要是语音卡、语音信道或是以数字编码形式存在的虚拟通道,如IP的语音编码数据包等;而在PC平台上,声卡则成为主要的语音通道。

对不同平台的语音通道物理设备的支持,决定了VoiceXML语音浏览器是一个可实际应用的平台。

2.VoiceXML语音浏览器各部分的协作

VoiceXML语音浏览器的协作核心是VoiceXML解析器,其通过建立应用和会话,获取包含控制命令的文档,根据文档中的标志建立对话,从而解释各个对话,控制语音识别、语音合成引擎以及语音通道的触发、开启关闭和挂起等,实现与用户的会话式的交互,并根据对用户反馈的识别结果进行导向判断,进行文档之间的转移和应用之间的转移。

3.VoiceXML语音浏览器的开放机制

在无限商机公司的VoiceXML语音浏览器中,对识别引擎和合成引擎进行了开放性的接口设计,实现了与引擎无关的设计。根据此接口,开发商可以开发用于其他识别或合成引擎的封装模块,从而在无限商机的VoiceXML语音浏览器中使用其他的识别或合成引擎。其可建立于电话服务器、PC 、嵌入式设备中,支持国内外语音卡,支持IP等语音信道。

无限商机公司VoiceXML语音浏览器中,所有开发接口是以CORBA规范设计的,开发商可以用各种编程语言,如C、C++、Java等,在不同的平台和操作系统上实现,从而实现对各种操作系统平台的支持。并且,利用CORBA强大的分布式机制,整个VoiceXML语音浏览器可以建立于跨越各种物理平台、操作系统之上的分布式网络中。

4.在VoiceXML语音浏览器上开发语音应用

在VoiceXML语音浏览器上开发语音应用,如同开发Web应用一样轻松简单,只需要有XML的知识,就可以开发VoiceXML应用。基于VoiceXML的语音应用系统,可以很好地与其他已有的Web 应用系统或数据应用系统实现良好结合。

在VoiceXML语音浏览器基础上的应用开发,改变了传统的CTI系统的开发概念。开发人员不必关心复杂的流程和模块,不必为数据接口编写程序模块,不必重新建立已有系统的逻辑实现,也不必一次次地重复某个模块的开发。

计算机世界网 2001/10/19



  ·Polycom 极致高清视频会议体验活动---免费获赠万元奖品
  ·“呼动中国”:东进技术多媒体呼叫中心招募增值渠道合作伙伴

  ·招聘:商路通 怡海软件 正音科技 上海宝东 东进通讯 亿迅(中国)

  ·《2008中国呼叫中心产业发展研究报告》正式出版 2008-8-25  
  ·最新资料:《企业呼叫中心建设指南》 《企业通信案例及方案大全》
  ·免费索取:《多媒体交换机资料》   技术前沿资料:《IP、无线和视频方案》


  ·IP分布式呼叫中心在各行业应用
  ·鼎晟DS-iTouch联络中心
  ·呼叫中心座席革新--话务通MA

            


企业会员
易宝通讯 三汇软件 陕西公众信产公司
拓敏信息 卓大兴业 正音科技
加入办法 ->





CTI论坛推荐
·新太科技企业呼叫中心解决方案
·上海维卡推出VN系列电话语音卡
·CTstage 5i客户联络中心-适用大规模分散网点
·三友亚星:上海红孩子电话营销和客服系统
·什么是IP分布式呼叫中心
·呼叫中心座席革新--话务通MA
·语音合成:InterPhonic 5.5在线演示系统
·东进技术:Seegoe Enterprise/Office呼叫中心
   
相关链接
CTI论坛周刊 融合通信专栏
行业案例汇编 免费发布新闻
管理员俱乐部 服务与营销论坛

热 点 专 栏
|业界新闻|论坛文摘|行业应用|产品展示|技术天地|厂商汇总|免责声明|咨询服务|公司简介|联系方法|广告服务|企业会员|

编辑投稿信箱      如何查找厂商联系方法

电话:010-82012787,82079677   传真:010-62041062
呼叫中心建设及运营管理咨询服务:优胜资讯(010)87768798 87768726