首页>>厂商>>语音识别与合成>>科大讯飞

科大讯飞电话语音识别InterReco 2.0——应用开发及工具包

2008/08/18

  为了方便语音识别系统的开发,InterReco2. 0提供了一系列的开发接口和应用工具,从而使得应用系统的开发更加高效,主要包含如下:

一、应用开发接口

  语音识别接口是InterReco提供的最重要的对外接口,是应用开发人员使用识别引擎进行语音识别开发所必需使用的接口。这个接口提供强大的功能,能够发挥InterReco语音识别系统的优势,通过不同的并发编程模型简化编程复杂度,优化系统性能表现。    语法编译管理接口提供API形式的语法编译和管理的方法,主要用来解决动态语法的编译、加载、激活的过程。用户根据需要使用这些接口可以对自己的应用程序做出恰当的优化,提高应用系统灵活性。语法管理接口允许用户管理和设置语法缓冲的策略。    端点检测是语音识别一个重要的输入环节,该接口允许用户通过编程对端点检测的处理策略,和语音识别引擎进行交互。    该接口提供一套能够使用户把电话语音输入设备挂接到InterReco语音识别引擎的方法,包含各种品牌的电话语音卡和麦克风。通过这个接口,能够消除输入设备的多样化带来的集成复杂度,使得产品在音频输入方面具备优秀的可扩展性。    该接口提供管理维护接口、日志接口、以及其他一些辅助接口。

二、应用优化方法

  分析和优化在语音识别的开发、应用过程中扮演非常重要的角色,好的分析和优化工具往往能够决定语音识别的应用是否能够成功。InterReco 2.0中提供的主要分析优化方法有:    通过Call-Log纪录,使用分析工具分析统计,得出当前应用的总体识别率、语法内识别率等重要技术指标。这些指标能够反映出当前语音应用的总体识别效果,同时也能够分析应用中存在的问题。    通过识别效果的分析,对识别的语音界面、识别语法、识别模型、系统参数进行优化,以达到提高用户满意度,提升识别效果的目的。    分为无监督和有监督的自适应,识别系统在运行过程中会以一定的间隔对当前的应用场景进行一次无监督的声学模型自适应,这种适应的内容包括:说话人特征自适应,包含口音和方言;通道特征自适应,包含无线通道、VoIP编解码通道;应用特征,包含词汇、环境噪声等。

三、工具包

  InterReco提供了丰富的开发调试工具,能够在集成开发的过程中为用户提供全面有效的支持。主要包含:    识别演示程序是一个基于对话框风格的Windows GUI界面,其主要功能是在Windows环境下,为用户提供一个简便、友好的方式,使得用户能够使用麦克风完成基本识别功能,或者使用离线识别功能,也可以设置一些系统参数验证其效果。    用户来可以直接用文本而不是实际语音对于自己编写的语法进行分析和调试。主要功能有:输出语法的所有定义范围、测试一个说法是否满足语法要求。    管理语法缓存工具,可以使用该工具查看当前InterReco系统语法缓存的详细情况,还可以使用该工具手工删除指定的语法缓存条目,该工具还提供了预先编译语法文件的功能。    用户自定义词典工具。通过该工具,可以对输入词条列表生成发音,并保存为用户自定义词典。

  这些开发接口和工具包可以帮助合作伙伴更快速的将语音识别产品集成到各中应用系统中,并作为合作伙伴在语音识别业务设计、调试和效果优化等各阶段的技术助手,帮助合作伙伴更快速的开发成功的语音识别应用系统。

CTI论坛编辑



相关链接:
讯飞畅言语音教具系统荣获“创新软件产品” 2009-09-08
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
“会说话”的显示屏提升居民小区信息服务水平 2009-09-07
讯飞语音助力太平人寿客服中心 2009-08-28
讯飞语音助力CDMA手机竞争终端市场 2009-08-14

分类信息:  增值电信_与_移动增值  增值电信_与_呼叫中心  增值电信_与_语音应用  移动增值_与_呼叫中心
           移动增值_与_语音应用  呼叫中心_与_语音应用