讯飞企业级语音平台
2001/06/12
讯飞企业级语音平台为大规模语音合成应用提供自然、流畅的语音合成。
应用范围
屡获殊荣的讯飞语音合成平台可以大大提高系统整体的服务质量,从而形成"最终用户--厂商--讯飞"的三赢局面。正成功的运用于电信、银行等行业的客户服务中心、Voice-Mail、Voice-Portal、UMS等系统之中,也可以运用于现有IVR平台之上。
讯飞企业级语音平台特点
1. 自然流畅的语音
基于多年研究成果开发完成,在历次的评审中,讯飞语音平台的单词、词组、句子的可懂度均居于业界领先的地位。
2. 高效的文语转化
讯飞企业级语音平台针对在多路并发环境下的运行效率进行了专门的优化,保证了在企业级应用中能够满足实时性的高效率要求。
3. 透明的可扩充性
用户可以在完全不修改客户端程序,不停止当前语音合成服务的条件下,增加和减少语音服务器的数量。
4. 可靠的稳定性
极为全面的测试,保证了讯飞企业级语音平台在电信级CTI系统中的可靠应用,其稳定性也得到讯飞客户的普遍认可。
5. 支持多种语音格式
支持包括PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等语音格式,支持Dialogic, NMS,东进,三汇等主流语音板卡。
讯飞语音技术优势
讯飞汉语语音合成技术,是在国家863项目、九五攻关项目、国家自然科学基金项目、以及中国科学院八五重大项目的支持下,历经十余年拼搏成为国内外同类技术中脱颖而出的"领头羊"。
同时,讯飞加大对基础研究的投入,致力于核心技术的领先,创立了"中文语音技术创业联盟",与中科院声学所、自动化所和中社科院语言研究所共建语音合成联合实验室,带动语音技术产业化能力和市场竞争力提高。
讯飞语音平台接入方式
开发接口
接口名称 |
说明 |
1. iFly TTS API |
包括标准接口和简易接口,详见产品附带开发文档 |
2. SAPI |
Microsoft SAPI 4.0 接口 |
InterPhonic Enterprise Edition
新一代讯飞企业级语音平台产品,合成效果更为出众。(正式产品将于近期推出)
产品特点
卓越的语音合成技术 |
多服务器协同的集群式服务 |
服务器之间的动态负载调度 |
安全可靠的数据传输机制 |
客户代理使应用开发大大简化 |
高性能--每分钟处理请求数不低于10 4次 |
高稳定性----系统安全运行时间不低于1年 |
高可靠性--系统的可用率不低于1-10-5 |
流式服务----客户端的平均响应时间较低 |
跨平台性--支持Windows 和UNIX系统 |
前后端一致性的文本分析体系 |
基于数据统计和人工智能的韵律模型构架 |
先进的语音学层次结构体系 |
基于改进型PSOLA算法的韵律调整功能 |
进一步发展为中英文混合系统的潜力 |
产品组成
InterPhonic语音合成运行库 |
InterPhonic语音合成服务程序 |
InterPhonic语音合成负载平衡组件 |
InterPhonic语音合成开发包 |
InterPhonic产品文档 |
软件锁 |
系统要求
支持的操作系统
Windows 98
Windows NT WorkStation / Server (SP4以上)
Windows 2000 Professional / Server / Advanced Server
Linux ( glibc 的版本高于2.2,内核版本支持:2.0.38;2.2.14;2.2.14-5.0;2.2.14-5.0-smp;2.2.14-smp;2.2.16;2.2.16-smp;2.2.17;2.2.17-smp)
支持的开发语言
VC、C++、VB、Delphi
硬件配置
最低配置 |
PIII 550; 64M RAM |
推荐配置 |
PIII 550*2; 256M RAM |
合成性能指标
实时性 |
在标准硬件配置、30个并发请求的情况下,合成50个汉字的最大响应时间小于6秒。 |
最大同时网络连接数 |
30 |
最大网络负载 |
32Mbps |
最大同时本地连接数 |
160 |
InterSpeech Enterprise Edition(原KD 2000 企业版)
目前主流的讯飞企业级语音平台产品
产品特点
优秀的语音合成技术 |
多服务器协同的集群式服务 |
服务器之间的动态负载调度 |
安全可靠的数据传输机制 |
客户代理使应用开发大大简化 |
高性能--每分钟处理请求数不低于10 4次 |
高稳定性----系统安全运行时间不低于1年 |
高可靠性--系统的可用率不低于1-10-5 |
流式服务----客户端的平均响应时间较低 |
跨平台性--支持Windows 和UNIX系统 |
产品组成
InterSpeech语音合成运行库 |
InterSpeech语音合成服务程序 |
InterSpeech语音合成负载平衡组件 |
InterSpeech语音合成开发包 |
InterSpeech产品文档 |
软件锁 |
系统要求
支持的操作系统
Windows 98
Windows NT WorkStation / Server (SP4以上)
Windows 2000 Professional / Server / Advanced Server
Linux ( glibc 的版本高于2.2,内核版本支持:2.0.38;2.2.14;2.2.14-5.0;2.2.14-5.0-smp;2.2.14-smp;2.2.16;2.2.16-smp;2.2.17;2.2.17-smp)
支持的开发语言
VC、C++、VB、Delphi
硬件配置
最低配置 |
Celeron 400; 64M RAM |
推荐配置 |
PIII 550*2; 256M RAM |
合成性能指标
实时性 |
在标准硬件配置、30个并发请求的情况下,合成50个汉字的最大响应时间小于6秒。 |
最大同时网络连接数 |
30 |
最大网络负载 |
32Mbps |
最大同时本地连接数 |
160 |
联系讯飞
地址:中国安徽合肥市长江西路669号
(合肥国家高新技术产业开发区软件园2号楼)
邮编:230088
电话:(0551)5331800
传真:(0551)5331801 5331802
电子邮件:iflytek@iflytek.com
获得讯飞企业级语音平台技术支持----
电话:0551-5331813
传真:0551-5331801 0551-5331802
电子邮件: tts-support@iflytek.com