鼎铭交换机同"CPCI+语音卡"平台在大容量语音应用中的对比
2004/08/30
随着电信基础业务向大众用户的不断普及,各种新兴的电信增值业务(电话QQ、彩铃、彩话等)也不断应运而生,而且受到广大用户的喜爱,电信增值业务的用户数在近几年内持直线上升。
随着电信增值业务持续发展,原先那种分散的、业务单一的、小容量的电信增值业务接入点也日渐面临着扩容压力及管理混乱等问题,这从很大程度上阻碍了电信增值业务的发展。
为了进一步规范电信增值业务的发展,各大运营商逐渐倾向于对原先的电信增值进行业务整合,原先的多点接入将逐渐发展为单点大容量的接入,原先的多种业务的分散平台将逐渐发展为同时提供多种业务能力的综合平台,这种整合的趋势,将对业务接入点的接入容量和处理性能提出更高的要求,特别是在大容量的语音处理方面。
例如彩铃、彩话,其业务要求有足够的语音资源来实现各种个性音乐和背景音的播放,当平台的接入量增大时,这就对平台提出了一个很实际的要求:如何实现大容量的语音播放。
下面对"工控机+语音板卡"和"COMPAQPCI+语音卡"平台同鼎铭VDP交换机平台在大容量的语音处理方面的区别进行说明。
一、"工控机+语音板卡"和"COMPAQPCI+语音卡"平台的瓶颈
经过广泛的调查,现有的"工控机+语音板卡"和"COMPAQPCI+语音卡"方案由于存在各种技术架构上的限制,将无法实现大容量的语音播放。
可以从以下三个方面来阐述它所存在的限制:
1、总线带宽
市面上大多数的语音板卡都是基于PCI总线设计的,由于PCI总线的时钟频率只有33M,每完成一次数据读写操作需要占用几个时钟周期,而目前市场上CPCI高密度语音板卡(4-16E1)内部DSP的HPI口一般都采用8位的数据读写,再加上机内的显卡,网卡,声卡等设备也占用了部分PCI总线的带宽,所以,在实际环境中,单机PCI总线的稳定数据传输速率只能达到4MB/S。按标准A律PCM语音格式来计算,"工控机+语音板卡"和"COMPAQPCI+语音卡"方式来构建的CTI系统,大概是500路的同时放音,如果是同时录放音,其支持的路数则要减半。
2、硬盘速率
绝大多数的语音平台都是采用整机方案,平台语音(主要是大量的歌曲、背景音等)都是存放在平台所在服务器的硬盘内的。由于硬盘是一种机械电子设备,其数据的读写是通过移动磁头来读写磁道上的数据的,这种机械操作的因素,使得硬盘速率具有很大的随机性。经测试,7200转/秒的IDE硬盘,其数据访问速率为2-6MB/S,这其中还不包括系统平台运行过程中其它的一些硬盘操作,如文件存取,数据库访问,数据拷贝等。
在保证语音播放的完整性和稳定性(即不出现语音慢速播放、语音丢失)的前提下,我们假设硬盘稳定的速率为2MB/S,那么,单机单硬盘就只能支持200-300路的同时文件放音(每路语音占用8KB/S),即放音时,语音数据从磁盘实时读取。
尽管我们可以采用内存放音的方式,即在系统平台初始化时,先将需要播放的语音从硬盘读取到内存里,需要放音时,直接由内存进行播放,这种方式对播放一些常用的不经常更换的提示语音可能比较适合。但对于某些语音业务,如彩铃/彩话,由于用户可以随意定制其个性化的背景音乐,每个用户所定制的背景音乐可能不同,而且随时都有可能更换,这种情况下,如果还使用内存放音方式,语音平台软件则可能需要作很多内存调度的处理,一来增大了平台软件的开发难度;二来也使得平台软件在运行过程中,频繁地作一些无必要的内存语音调度,增加系统开销。所以,对于彩铃彩话等语音增值业务,采用文件放音会是一种更合理的技术实现,但是文件放音方式在"工控机+语音板卡"和"COMPAQPCI+语音卡"平台方案中,则存在着硬盘速率的技术瓶颈。
目前市面上比较大容量的CPCI语音卡为16E1,在彩铃/彩话等需要大容量放音这类业务中,尽管其中继接入容量可以比较大,但在实现大量放音时,由于受以上硬盘速率瓶颈的限制,单台CPCI实际上一般超不过32E1的容量。
3、CPU处理能力
随着语音业务的不断细分及深化,TTS/ASR等语音处理技术也逐渐应用到语音增值业务中来。由于TTS/ASR的算法实现本身就需要耗用大量的CPU指令来进行运算,所以,在作TTS/ASR应用时,单机的CPU处理能力就存在着很大的限制。经测试统计,单台配置P4 2.0G的CPU的PC,最多能作60路的TTS语音,或者只能作30路的ASR语音识别,更何况在整机方案中,其它的CTI处理、流程控制等也需要占用很大一部分的CPU资源,实际支持的路数还要低。很显然,这种路数是无法适应大容量的语音处理的需求的。
二、鼎铭VDP交换机平台的处理方式
鼎铭公司整合先进的CTI行业理念及十几年的技术经验,全面分析了当前电信增值业务的行业背景,推出了全新概念的基于高速USB总线的分布式语音处理架构,它独立的语音处理模式和更具扩容潜力的灵活架构,全方位解决了整机方案中在进行大容量录放音时,系统总线带宽、磁盘速率、CPU处理能力等所存在的限制,可更轻松地面对各种超大容量的语音处理场合。
下面是鼎铭VDP交换机分布式语音处理架构的技术框图:

在VDP可编程交换机端,采用鼎铭公司自主研发的基于高速USB总线的语音数据传输板(VDT),通过USB线缆与后端的语音PC服务器(VS)相联,当VDP交换平台需要录放音时,只需通过TCP/IP网络,发送一条录放音消息指令到后台的语音服务器上,后台的语音服务器在收到录放音指令后,通过PC机内的USB总线对语音传输板上的语音数据进行读写,从而完成语音的录放。由于在整个录放音过程中,交换平台只需向后台的语音服务器发送简单的指令来启动录放音,而把录放音的大数据传输工作完全独立开来,交由后台的语音服务器处理,使得交换平台在完成超大容量的语音传输处理时,VDP总线、CPU、硬盘等系统资源的占用几乎为零。
下面将仍就系统总线带宽、磁盘速率、CPU处理能力等三个方面,分析分布式语音处理架构系统方案与"工控机+语音板卡"和"COMPAQPCI+语音卡"平台方案相比,所具备的优点:
1、系统总线带宽
语音数据传输板(VDT)基于USB2.0标准设计,采用高速传输模式,速率最高可达480Mbit/s,即60MB/s,理论可支持几千路的语音数据传输,对比起单台PC语音服务器的CPU处理能力和硬盘速率,其总线带宽几乎是无限的。
2、磁盘速率
基于鼎铭分布式语音处理架构,当需要进行大容量文件录放音时,只需增加一台或多台语音服务器,将文件录放音对硬盘的繁烦操作交由后台各个语音服务器去处理,这种分布式的处理方式,不存在整机方案中硬盘速率的瓶颈,保证了语音业务的稳定性。
3、CPU处理能力
采用鼎铭分布式语音处理架构,在需要进行大容量的TTS语音/ASR语音识别的应用场合,整机方案中CPU处理能力的限制将不复存在,按单台语音PC服务器可处理50路TTS或者30路ASR来计算,如果语音平台系统需要增加50路的TTS语音,只需增加1台语音PC;如果需要100路的TTS语音,只需增加2台语音PC;当需要90路的ASR时,只需增加3台语音PC,这种灵活的架构既保证了TTS/ASR功能的稳定实现,又保证了系统的扩容能力,使得大容量语音平台的构建更加轻松从容。
鼎铭VDP系列可编程交换机一体化的设计理念,结合基于高速分布式语音处理架构,将为电信增值业务提供最具扩容能力,最具市场竞争力,最具增值潜力的硬件平台解决方案。
深圳鼎铭电子公司供稿 CTI论坛编辑