中科信利

中科信利语种识别引擎

2016-05-24 16:01:39   作者:   来源:CTI论坛   评论:0 点击:


  中科信利语种识别引擎能够在连续语音中自动提取语音的语种信息。
  中科信利的语种识别技术将从声学层特征和音子序列特征的提取,分别采用了声学建模和语法建模的方法,来描述这些特征的空间分布情况,并且以此来构建高层的得分向量空间,通过分类器对得分向量进行划分,以达到自动分类判决的目的,以使得语种识别技术能满足实际的应用需求。
  工作原理:
  功能模块:
  预处理:将语音分段,尽可能的保证每段语音只包含同一个说话人或者同一类非语音,此外,也要保证检测出的说话人或者同一类非语音的虚转折点少;噪声检测,检测出电话语音数据中包含的传真音、震铃、音乐彩铃等非有效说话人语音。
  特征提取:在语种识别技术中,选取能够表征语种类别特征的有效而可靠的特征参量,是保证识别性能的重要因素之一。语音信号的长时差分频谱特征,包含了语音信号中的语义信息、说话人信息、语种信息。分析语音信号的频谱特性可以用来确认各个目标语种。
  模式匹配:指的是通过建立统计模型,将低层声学特征转换为高层的得分向量特征。中科信利的语种识别系统中,目标是对各个待识语种建立可靠模型,保证语种识别系统的性能。
  判决规则:语种识别系统的输出一般都是对各个目标语种有个打分,这些得分都是通过将测试语音同模型库进行似然概率计算或者进行距离度量所得到。
  技术特点:
  • 与发音人无关,与传输信道无关。系统对用户的输入声音进行鉴别和确认,可以来源不同的信道。
  • 对语音长度有一定的要求。待识别的测试语音有效长度不小于3秒。
  • 识别速度快,能确保实时识别。说话人识别引擎每次一对一比对,在普通PC上具有0.01倍以上的实时率,并且支持多路并发识别。
  • 操作点调整方便:可按不同的应用需求调整操作点阈值,可以调整虚警率和漏警率,使最终准确率达到最高或使错误率降到最低。
  • 操作点调整方便,可按不同的应用需求调整操作点阈值,使系统性能根据应用需求达到最优。
  • 支持自动添加新语种的训练,满足用户扩充。
  性能指标:

相关热词搜索: 中科信利 语种识别

上一篇:第一页

下一篇:最后一页

相关阅读:

分享到: 收藏

最新新闻