首页>>厂商>>语音板卡开发商>>东进技术

D系列语音卡的连续语音处理技术(CSP

D系列语音卡采用DSP技术进行连续语音处理(CSPContinuous Speech Process),在电话线路与语音识别引擎之间对语音数据进行预处理,从而提高了语音识别引擎的效率和识别率,为ASR的成熟应用奠定了基础,而东进D系列语音卡和IBM的综合语音处理解决方案也成为应用系统开发者的首选。

1、回声消除(ECR)

ECREcho Cancellation Resource)是基于DSP技术对语音通道的声音进行的实时控制。其实现方法在于:在电话线路上收到的声音里去掉IVR系统播放的声音,从而保证收到的声音是纯净的,如下图所示。

ECR原理

语音识别的过程实际是一个录音和声音比较的过程。当录下来的声音(收到的声音)是纯净或者比较纯净的时候,识别率将大大提高。

试验表明,采用回声消除技术后,语音识别率得到显著提高,从原有的70-80%提高到95%以上,满足了商用要求。

2、语音打断(Barge in

语音打断可以减轻系统资源占用,提高语音识别系统的利用效率,而且减少用户等待的时间,节省话费开支,为构建高精度和高密度的系统创造了条件。

3、语音检测(VAD)

语音检测 (VAD-Voice Activity Detection)技术的应用是实现语音打断的前提。其原理是检测线路上的声音能量(Voice Energy Detection),只有在检测到语音後才启动录音和语音识别进程。

4、4-120路语音处理,D系列语音卡可以支持4-120路连续语音处理能力。

5、基于D系列语音卡的ASR的结构,如下图所示: