CTI论坛: D系列语音卡的连续语音处理技术（CSP）

D系列语音卡的连续语音处理技术（CSP）

D系列语音卡采用DSP技术进行连续语音处理（CSP，Continuous Speech Process），在电话线路与语音识别引擎之间对语音数据进行预处理，从而提高了语音识别引擎的效率和识别率，为ASR的成熟应用奠定了基础，而东进D系列语音卡和IBM的综合语音处理解决方案也成为应用系统开发者的首选。

1、回声消除(ECR)。

ECR（Echo Cancellation Resource)是基于DSP技术对语音通道的声音进行的实时控制。其实现方法在于：在电话线路上收到的声音里去掉IVR系统播放的声音，从而保证收到的声音是纯净的，如下图所示。

图 ECR原理

语音识别的过程实际是一个录音和声音比较的过程。当录下来的声音（收到的声音）是纯净或者比较纯净的时候，识别率将大大提高。

试验表明，采用回声消除技术后，语音识别率得到显著提高，从原有的70-80%提高到95%以上，满足了商用要求。

2、语音打断（Barge in）

语音打断可以减轻系统资源占用，提高语音识别系统的利用效率，而且减少用户等待的时间，节省话费开支，为构建高精度和高密度的系统创造了条件。

3、语音检测(VAD)

语音检测 (VAD-Voice Activity Detection)技术的应用是实现语音打断的前提。其原理是检测线路上的声音能量（Voice Energy Detection），只有在检测到语音後才启动录音和语音识别进程。

4、4-120路语音处理，D系列语音卡可以支持4-120路连续语音处理能力。

5、基于D系列语音卡的ASR的结构，如下图所示：