首页>>厂商>>交换机/ACD系统平台厂商>>东进技术

东进技术IBM VVT(Via Voice For Telephony)

2010/02/23



内容简介:

  针对电话应用进行特殊优化,采用美国IBM公司的ViaVoice Telephony技术,IBM VVT中文语音产品提供语音识别、语音合成功能,支持中文

  (简体汉字)、英语等语言,使系统开发人员可以方便地在电话通讯系统及网络平台上集成中文语音功能。中文语音识别(ASR-Automatic Speech Recognization),是CTI中的一项核心技术,能够为语音门户、电子商务、呼叫中心、电话通讯系统

  提供中文语音交互界面。IBM VVT提供开放式的语音识别引擎和一系列应用工具,使语音识别功能可以被方便地集成到CTI系统中.

中文语音识别 ASR的性能特点:

  与说话人无关:任何人都可以使用。

  高识别率:内部的语音识别引擎是使用真实的电话信道语音数据训练得到的,在正常的电话信道(包括手机或普通电话)的噪音下有很高的识别率。

  无限词汇量:由于语音识别内核是比基本音节还要小的单元,所以开发人员定义的任何词表,它都可以很好的辨识。

  连续发音:使用者不需要在词汇间有任何停顿,就可以同系统连续交谈。
  多语种支持:在中文普通话和粤语之外,同时支持美国英语、英国英语、法语、德语。
  多候选集的输出:能够输出不同的候选结果相似度得分。
  支持声学加词:说话人只需要输入语音信号即可完成加词。
  支持语音合成:能够从文字直接生成高自然度、高清晰度、高可懂度的语音。
  信道自适应:可以自动适应不同信噪比的电话信道。
  自然语言理解模块:提供更加人性化的人-机对话接口。
  出色的可伸缩性:提供从小型办公室到企业级电话语音系统解决方案,小到单机系统,大到可灵活组合的客户服务器模式,更提供全自动的动态负载平衡,让您有限的投入能够获得更高的效能。

语音识别技术在CTI系统中的应用优势

  拓展了输入信息的广泛性,使用语音命令替代DTMF按键操作。

  极大减少语音菜单的层次:传统的电话语音应用,使用多层次的菜单,使用起来非常不方便。采用语音识别技术,可以捕捉用户说话中的关键字,自动导向合适的功能,整个系统的菜单深度就可以大大降低。

  增加了语音流程的灵活性,可以非常灵活的在各个子菜单之间切换。

  方便用户使用,比如在证券电话应用中,用户可以直接说出股票名字,而不再需要记忆股票代码。

  取代人工操作,降低服务成本。

体系结构与部署

  IBM ViaVoice For Telephony是一套工作于客户/服务器/集群模式下的软件系统。

  可以同时为多个电话通道提供服务。

  支持多路并发工作同时为多条电话线路提供语音识别服务。

  支持客户服务器模式:可以将执行传统的电话语音流程的应用系统作为客户机,使用专门的服务器提供语音识别的计算。

  支持基于局域网的自动负载平衡:允许在网络上同时分布多台语音识别服务器,系统自动寻找负载最轻的服务器,向它提交服务,保证系统工作效率达到最优。

  支持自动故障恢复冗余:在网络上存在多台服务器时,如果有一台服务器瘫痪,系统能够自动跳过不可用的服务器,系统可能会因此变得反应速度比较慢,但是不会瘫痪。

  支持单机模式:对于小型系统,可以采用简单的单机模式进行工作,从编程方面来说,单机模式与客户/服务器或者集群方式没有区别。

系统运行硬件环境

IBM兼容PC,Intel PII 300MHz或更高,128M内存或更高
D系列语音卡

支持的操作系统
Windows NT4.0
Windows 2000

开发接口
Visual Basic
C (Visual C++, Borland C++ ……)
Delphi
Visual FoxPro
Power builder

其它支持COM接口的开发平台

软件工具
丰富的范例程序源代码

产品应用

语音门户(Voice Portal Platform)
电信与互联网服务提供商
交互式语音应答系统(IVR)
呼叫中心(Call Center)
旅游、交通、民航查询系统
银行、金融、保险、证券电话委托系统
信息台/传呼台
企业114(机器人话务员)

CTI论坛报道



相关阅读:
DJ-TTS东进中文TTS(文语转换)系统软件及开发平台 2010-02-23
2线USB录音盒(D081U-2) 2010-02-23
4线USB录音卡(D081U-4) 2010-02-23
4线EM中继语音模块 2010-02-23
2线EM中继语音模块 2010-02-23