2001/08/10
一、 捷通TTS(jTTS)介绍
1.1. 捷通TTS技术文语转换的基本原理
捷通TTS技术文语转换的基本结构:
1.1.1. 语言学处理
----语言学处理在文语转换系统中起着重要的作用,他主要是模拟人对自然语言的理解过程--文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。
1.1.2. 韵律处理
----韵律处理的目的是为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然悦耳。
1.1.3. 声学处理
----声学处理的主要功能是根据前两部分处理结果的要求输出语音,即合成语音。
1.2. 捷通TTS的特点
捷通公司的TTS技术(jTTS),是具有自我版权的TTS技术,以大规模真实录音的语音库为基础,采用多样本、不等长言语段波形拼接技术,增加音库压缩算法和音色变换算法形成核心技术,发音清晰流利、自然度高。
捷通TTS在文本到语音的转换过程中不是对文字到语音的简单映射,还包括了对文字的理解,以及对语音的韵律处理。
捷通通过研究汉语的声调、重音、语调的声学特点,设计了重音和语调的模拟。
捷通TTS在韵律规则方面,采用统计和规则相结合的方法,研究了汉语韵律规则并进行了一定的韵律模拟工作,以韵律层级的匹配作为选音段的基本原则。
捷通TTS提供中英文混读功能,嵌入中文内部的常用单词的音色与中文保持一致,更加自然流畅。
捷通TTS的音库大小可调节,能提供从PC、语音卡到掌上电脑TTS技术的全面解决方案。可以将音库和程序压缩到共1.5M的水平,实现了在嵌入式系统上的应用。
提供捷通TTS开发工具包(jTTS SDK),可以合成到声卡,合成到文件,直接获取语音流,支持多线程操作,支持GBK、BIG5字符集的文本阅读。
其中音库大小可调节的特点是捷通TTS能够移植到掌上电脑等嵌入式设备的关键特点,也是捷通TTS独具的优点。
----捷通公司在2001年7月完成了最新版本的捷通TTS技术。新版本基于大规模真实录音的语音库,音库提供的样本多,选音范围大,可选择到更匹配的发音,另外,在选音和拼接时将超越了音节的层次,能够进行词甚至短句层次的拼接。因此,在自然度、可懂度方面捷通新TTS具有较大的提高。再加上英文单词的音色与中文保持一致,可支持GBK字库中的所有字符的发音,新的捷通TTS技术的合成的语音几乎达到自然说话的效果。
......
网上全文:http://www.ctiforum.com/factory/tts/www.infoquick.com.cn/infoquick01_0803.htm
|