ViaVoice电话语音系统开发工具
IBM ViaVoice电话语音系统开发工具是IBM公司中文语音识别技术的最新成果,为使用者提供了一个开放式的语音识别引擎和完善的应用开发环境。用户可以方便快捷地在电话系统中集成语音识别功能,为声讯服务系统、电子商务平台和涉及电话通信的语音应用系统提供语音交互界面。
IBM ViaVoice电话语音技术具有广泛的应用前景。大量的交互式语音响应(IVR)系统可以加载ViaVoice电话语音引擎,成为许多行业中新的热点。
- 电信通讯业-- 电话转接、自动寻呼、声讯服务
- 金融保险业-- 帐户查询、股市行情、保险咨询
- 交通旅游业-- 机票定购、景点查询、旅馆预定
- 信息网络业-- 商情预报、有声网页、新闻检索
IBM ViaVoice电话语音引擎特点
*连续语音识别率高
- 语音识别引擎采用实际电话信道的语音样本,对于普通电话和移动电话均能获得很高的识别率,使用者说话时字与字之间无须刻意地停顿。
*语音信道适应性好
- 语音识别引擎没有特定授话人的限制,任何能讲标准汉语普通话的人都可以使用,而且系统可以自动适应不同信噪比的电话信道。
*应用系统伸缩性强
- 电话语音的应用不但可以运行在单机系统上,更可以扩展为多引擎、多服务器的大型企业级应用,动态的负载平衡能力可以令系统时刻保持最优的效能。
*语音合成自然清晰
*无限量词汇表识别
- 开发人员定义的任何词表,都可以由语音识别引擎辨识。
*词汇添加方法灵活
- 使用者只需输入语音即可添加词汇,也可以在系统运行状态下对词汇集进行动态添加。
*标准应用编程接口
- 与硬件无关的C/C++应用编程接口,可以方便地挂接语音识别引擎和语音合成引擎。
*采用多候选集输出
- 电话语音识别引擎可以输出不同候选结果及相似度得分。
IBM ViaVoice电话语音工具库内容
*基于Web的语法开发和管理工具
- 一套集成的Web程序,用来生成ViaVoice电话语音引擎所需的资源,包括语法和发音文件。还可以用于监测和管理所有电话语音识别进程的状态。
*命令行语法开发工具
- 这是一套为电话语音应用生成语法和发音的命令行工具。
*TCL扩展
- 可以让开发商用TCL脚本语言进行快速的IVR原型开发,测试应用程序的呼叫处理流程(call
flow)。
*C++电话语音类
- 面向对象的C++语音识别引擎和语音合成引擎编程接口,与硬件无关。
*应用开发示例
- 提供若干TCL脚本示例和C++程序示例。另外还提供了一些语法示例。
*程序员参考手册
*实用程序
- 软件中还包括其它一些命令和实用程序,可用于查看,管理和测试ViaVoice电话语音系统,例如:
- DialWatch--显示呼叫线的当前状态,以及日志进程的输出
- Listres----列出指定资源的当前值
- Logtail----用于监测系统事件和错误的命令行实用程序
- Setdbg-----设置指定进程的调试级别
- Text2pcm---将文本转换为语音输出
- Tsmcon-----控制一台主机上的调度进程
电话语音服务器配置要求
| 处理器:
Intel Pentium Pro 200MHz或更快的兼容CPU |
| 内存:
至少256MB (单机系统至少128MB) |
| 硬盘空间:
至少150MB 可用空间 |
| 电话语音卡:
符合电信标准 |
| 操作系统:
Microsoft Windows NT Workstation V4.0简体中文版,并安 装有Service Pack 4或更高版本 |
| 开发环境:
Microsoft Visual C++ Version 5.0或更高版本 |
·
·
·
|