首页>>厂商>>语音识别与合成>>科大讯飞

讯飞企业级语音平台

2001/06/12

讯飞企业级语音平台为大规模语音合成应用提供自然、流畅的语音合成。

应用范围

屡获殊荣的讯飞语音合成平台可以大大提高系统整体的服务质量,从而形成"最终用户--厂商--讯飞"的三赢局面。正成功的运用于电信、银行等行业的客户服务中心、Voice-Mail、Voice-Portal、UMS等系统之中,也可以运用于现有IVR平台之上。

讯飞企业级语音平台特点

1. 自然流畅的语音
基于多年研究成果开发完成,在历次的评审中,讯飞语音平台的单词、词组、句子的可懂度均居于业界领先的地位。

2. 高效的文语转化
讯飞企业级语音平台针对在多路并发环境下的运行效率进行了专门的优化,保证了在企业级应用中能够满足实时性的高效率要求。

3. 透明的可扩充性
用户可以在完全不修改客户端程序,不停止当前语音合成服务的条件下,增加和减少语音服务器的数量。

4. 可靠的稳定性
极为全面的测试,保证了讯飞企业级语音平台在电信级CTI系统中的可靠应用,其稳定性也得到讯飞客户的普遍认可。

5. 支持多种语音格式
支持包括PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等语音格式,支持Dialogic, NMS,东进,三汇等主流语音板卡。

讯飞语音技术优势

讯飞汉语语音合成技术,是在国家863项目、九五攻关项目、国家自然科学基金项目、以及中国科学院八五重大项目的支持下,历经十余年拼搏成为国内外同类技术中脱颖而出的"领头羊"。

同时,讯飞加大对基础研究的投入,致力于核心技术的领先,创立了"中文语音技术创业联盟",与中科院声学所、自动化所和中社科院语言研究所共建语音合成联合实验室,带动语音技术产业化能力和市场竞争力提高。

讯飞语音平台接入方式

 

 

开发接口

接口名称

说明

1. iFly TTS API

包括标准接口和简易接口,详见产品附带开发文档

2. SAPI

Microsoft SAPI 4.0 接口

 

InterPhonic Enterprise Edition

新一代讯飞企业级语音平台产品,合成效果更为出众。(正式产品将于近期推出)

产品特点

卓越的语音合成技术

多服务器协同的集群式服务

服务器之间的动态负载调度

安全可靠的数据传输机制

客户代理使应用开发大大简化

高性能--每分钟处理请求数不低于10 4

高稳定性----系统安全运行时间不低于1年

高可靠性--系统的可用率不低于1105

流式服务----客户端的平均响应时间较低

跨平台性--支持Windows UNIX系统

前后端一致性的文本分析体系

基于数据统计和人工智能的韵律模型构架

先进的语音学层次结构体系

基于改进型PSOLA算法的韵律调整功能

进一步发展为中英文混合系统的潜力

 

产品组成

InterPhonic语音合成运行库

InterPhonic语音合成服务程序

InterPhonic语音合成负载平衡组件

InterPhonic语音合成开发包

InterPhonic产品文档

软件锁

系统要求

支持的操作系统

Windows 98

Windows NT WorkStation / Server (SP4以上)

Windows 2000 Professional / Server / Advanced Server

Linux ( glibc 的版本高于2.2,内核版本支持:2.0.38;2.2.14;2.2.14-5.0;2.2.14-5.0-smp;2.2.14-smp;2.2.16;2.2.16-smp;2.2.17;2.2.17-smp)

支持的开发语言

VC、C++、VB、Delphi

硬件配置

最低配置

PIII 550; 64M RAM

推荐配置

PIII 550*2; 256M RAM

合成性能指标

实时性

在标准硬件配置、30个并发请求的情况下,合成50个汉字的最大响应时间小于6秒。

最大同时网络连接数

30

最大网络负载

32Mbps

最大同时本地连接数

160

 

InterSpeech Enterprise Edition(原KD 2000 企业版)

目前主流的讯飞企业级语音平台产品

产品特点

优秀的语音合成技术

多服务器协同的集群式服务

服务器之间的动态负载调度

安全可靠的数据传输机制

客户代理使应用开发大大简化

高性能--每分钟处理请求数不低于10 4

高稳定性----系统安全运行时间不低于1

高可靠性--系统的可用率不低于1105

流式服务----客户端的平均响应时间较低

跨平台性--支持Windows UNIX系统

产品组成

InterSpeech语音合成运行库

InterSpeech语音合成服务程序

InterSpeech语音合成负载平衡组件

InterSpeech语音合成开发包

InterSpeech产品文档

软件锁

系统要求

支持的操作系统

Windows 98

Windows NT WorkStation / Server (SP4以上)

Windows 2000 Professional / Server / Advanced Server

Linux ( glibc 的版本高于2.2,内核版本支持:2.0.38;2.2.14;2.2.14-5.0;2.2.14-5.0-smp;2.2.14-smp;2.2.16;2.2.16-smp;2.2.17;2.2.17-smp)

支持的开发语言

VC、C++、VB、Delphi

硬件配置

最低配置

Celeron 400; 64M RAM

推荐配置

PIII 550*2; 256M RAM

合成性能指标

实时性

在标准硬件配置、30个并发请求的情况下,合成50个汉字的最大响应时间小于6秒。

最大同时网络连接数

30

最大网络负载

32Mbps

最大同时本地连接数

160

 

 

联系讯飞

地址:中国安徽合肥市长江西路669

(合肥国家高新技术产业开发区软件园2号楼)

邮编:230088

电话:(05515331800

传真:(05515331801 5331802

网址:www.iflytek.com

电子邮件:iflytek@iflytek.com

获得讯飞企业级语音平台技术支持----

电话:0551-5331813

传真:0551-5331801 0551-5331802

电子邮件: tts-support@iflytek.com