首页>>厂商>>语音板卡开发商>>Aculab

Aculab的TTS(文语转换)技术

2004/04/28

  Aculab的V3.0版TTS性能明显提升,包括对W3C标准语音合成标记语言(SSML)的支持、对新增的巴西葡萄牙语和意大利语的支持以及更新的英国英语男声和西班牙语的女声、对所有支持语言发音和韵律的改善处理,以及发声字典工具的提供。Aculab的基于主机TTS,采用的是完全可伸缩的、运行快速且准确的波形拼接语音合成算法,具有占用内存小、通道容量大和采用客户机/服务器结构等特点。

  Aculab的TTS和Prosody DSP资源卡一起工作。Prosody板卡除了担当合成的音频信号放音功能外,还能同时启动其他DSP资源的运行。据此,开发商可以采用Aculab的统一API,把TTS`、语音识别及其他不同的语音处理算法结合起来,从而提高语音增值业务的性能。当和Prosody板卡一起使用时,TTS可以在Aculab的网站上免费下载。

语音技术

  随着近来语音和语言处理技术的快速发展,采用Aculab TTS和Prosody板卡可以创建更为复杂的、具有创新意义的应用解决方案,来满足多元化市场的需求。例如,用户接通统一消息应用后,就可以用电话访问并听取具有电子格式的文本消息。这类应用对于那些不在办公室、却又需要及时收取电子邮件的人来讲意义非凡。在呼叫中心环境里,采用TTS可以把文字信息念给呼叫用户听,企业或其他机构可以在不增加业务人员的前提下,改善客服的质量。

  这类语音应用都需要把文字信息念出来,在文字信息频繁更新或预先录制语音成本过于昂贵的情况下,TTS的价值尤其显著。

  Acualb TTS技术是因此类应用应运而生的。他的独特之处是在技术开发过程中已充分考虑到了电话网络带来的局限,如有限的带宽、嘈杂的电话接听环境以及应用对高通道密度的需求。Aculab的TTS即使在处理很长的文本段落时,也能合成出一致性强和智能化的电话语音。

TTS系统结构

  Aculab的TTS和Prosody板卡配合使用,无论是PCI还是cPCI格式的Prosody板卡都能通过E1或T1网络接口输出合成的语音信号。这个TTS软件和任何一种Aculab的、支持64Kbit/s速率放音的语音算法固件都兼容。Aculab的TTS也可以在一个DSP处理器内,同时运行其他语音处理算法,如录音、回波抵消,以支持语音识别所需的"barge-in"。

  所有这一切意味着:开发商可以受益于多种Prosody语音技术的灵活组合,来构建可靠性强的、高性能的和可扩展的应用系统。

SSML支持

  Aculab现在支持W3C的SSML标准,更进一步地提高了应用中的灵活性。

  允许在给定的文本内进行语音学标注,可以为易于混淆的词提供正确的发音,如:把"Smyth"读成"Smith"而不是"Smythe"。

  SSML标准提供的标记能改善文本预处理的性能。加上简单的标记,就可以很容易地判定数字1956是读成年份、整型数还是一个数字串。

  有了对SSML的支持,Aculab的TTS可以在文本内改变声音或语言特性,并能控制基频、语音速率、停顿和重音等。当合成的和预录的语音混合使用,或需要为特定的听众定制声音播放时,这些特性更有用。

通道容量

  TTS应用里,文本需要通过电话线路传输然后读出来,所以应用中要考虑一些特殊的因素:包括中继线的数量、DSP的处理能力以及主机负载和处理能力等。采用基本的Intel Pentium III / 700MHz的客户机,配合具有两个DSP处理器和PM4模块的Prosody板卡,就可以利用Aculab的TTS轻松地同时向120个呼叫用户播放根据文本转换来的语音。所以,开发商可以放心地实施高密度的语音解决方案,来提高竞争能力。

特性总结

·支持的语言
  可以动态改变。支持的语言包括:英国英语、美国英语、法语、德语、欧洲西班牙语、巴西葡萄牙语、意大利语和拉丁美洲西班牙语等。

·声音变化
  每种语言都有预配置的声音类型。Aculab的新版TTS允许开发商选择多达十种的语音变种。

·操作系统
  支持Windows NT 4.0,Windows XP/2000,Linux和Sun SPARC Solaris等。

·免费的许可证
  不收取按通道计算的使用许可证费用,可以随时随地在Aculab网站上下载。

·文本输入格式
  Unicode和XML / SSML。

·E-mail预处理
  这是一个可选的模块,用来处理e-mail里特定的文本,如邮件地址、消息头和URL等。V3.0 TTS扩充了这部分功能,使得e-mail消息的处理更加自然和准确。

·文本的归一化
  鉴别和适当扩充某些特殊文本域,包括日期、时间、货币、银行账号、电话号码、缩略语以及一些标点符号(如引号、括号、星号等)。

·语调、重音和间隔
  由于Aculab的TTS采用了更为复杂的语言模型来提高合成声音的自然度和韵律特征,所以这些指标都有显著改善。合成的语音能准确地依参数而改变,确保了合成语音的可懂度。

·词典管理
  为了满足开发商调整发音或增加新词的需要,Aculab开发了具有图形用户界面、和平台无关(Java)的词典管理器。新版的此工具能用TTS把输入字典的词语读出来。

·采样率
  和电话带宽相应,TTS合成系统采用8KHz的采样率。

·向兼容
  采用TTS API,可以方便地控制音量、基频和语音速率等。新增的SSML特性能更有力地控制这些TTS输出涉及的语音特性。

Aculab公司供稿 CTI论坛编辑



相关链接:
Aculab增强对Asterisk商业版的支持 2006-11-21
信令与媒体网关GroomerII的卓越IP和SS7处理能力 2006-11-17
Aculab产品的七号信令监控功能 2006-10-11
Aculab公司的最新产品研发 2006-09-19
Aculab发布最新产品——Prosody X PCIe板卡 2006-09-14

分类信息:     技术_语音板卡_新闻   技术_语音板卡_文摘