首页>>厂商>>语音识别与合成>> 捷通华声

捷通华声语音合成(jTTS)技术介绍及解决方案

2002/09/01

一、 捷通华声TTS(jTTS)介绍

1. 捷通华声TTS技术文语转换的基本原理

捷通TTS技术文语转换的基本结构:

  语言学处理在文语转换系统中起着重要的作用,他主要是模拟人对自然语言的理解过程--文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。

  韵律处理的目的是为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然悦耳。

  声学处理的主要功能是根据前两部分处理结果的要求输出语音,即合成语音。

2. 捷通华声TTS的特点

  捷通华声公司在2001年7月完成了最新版本的捷通华声TTS核心。新版本基于大规模真实录音的语音库,音库提供的样本多,选音范围大,可选择到更匹配的发音,另外,在选音和拼接时将超越了音节的层次,能够进行词甚至短句层次的拼接。因此,在自然度、可懂度方面捷通华声新TTS具有较大的提高。再加上英文单词的音色与中文保持一致,可支持GBK字库中的所有字符的发音,新的捷通华声TTS技术的合成的语音几乎达到自然说话的效果。

3. 捷通华声TTS的进一步发展方向

  捷通华声TTS将在下面几个方向发展:

二、 捷通华声TTS技术(jTTS)在CTI领域中的应用

  捷通华声TTS技术在CTI行业中的应用提供三种解决方案:本地接口调用方案、语音服务器方案、离线合成方案。

1. 捷通华声TTS本地接口调用方案(jTTS SDK)

方案概论:

  本地接口调用方案提供捷通华声TTS开发工具包(jTTS-SDK)可使用户在其开发的系统中加入语音合成的功能。jTTS-SDK是基于Win32(32位Windows环境,包括Windows95/98/2000/NT)平台下的开发工具包,因此这种方案要求使用方的声讯服务系统所运行的是32 位Windows环境的服务器,并且需要对使用方系统进行部分程序的改造。该方案适用于要求使用方具有二次开发能力的集成和应用商。


本地接口调用方案架构图

2. 捷通华声TTS语音服务器方案 (jTTS Service )

方案概论:

  语音服务器方案直接提供装载有捷通华声TTS语音服务系统的高性能的服务器,它与现有的声讯服务相平行,接受其指令和文字数据流,合成产生语音数据流返给原系统,适用于电信、大型企业CTI系统及声讯台改造、升级。


语音服务器方案架构图

技术优势:

1. 降低了客户端机器的配置需求。
2. 通过TCP/IP协议实现了跨操作系统的语音合成服务功能,可以满足非Win32平台的需求。
3. 对于服务规模较大的系统可实现语音服务器的分布式工作方式,对客户端的请求自动调度,平衡负载,以达到更高的性能。

应用领域:

  采用语音服务器方案可在不改变现有服务系统的条件下,平行地建立捷通华声TTS语音服务器,安全、高效率地将原来的文本服务扩大为文本-语音同时服务,是大型、专业级的语音服务解决方案,并可跨平台实现。捷通华声TTS语音服务器方案可服务于160、168等声讯台、UMS统一信息服务系统、呼叫中心、语音邮件商、WAP网站、进行网上播音的.com公司等。

3. 捷通华声TTS离线合成方案(jTTS Builder)

方案概论:

  捷通华声TTS离线合成方案提供离线合成工具,这是基于Microsoft Windows 95/98/NT/2000的独立应用程序,可提供离线的语音合成服务,批量地将文字转换为语音数据文件,适用于海量信息、相对稳定或不要求实时转化的声讯服务场合,可以直接替代传统的录音方法,对原有系统完全无需改造,节省人力,提高效率。


离线合成方案系统架构图

三、 捷通华声TTS(jTTS)在嵌入式操作系统下的应用

  捷通华声公司的TTS技术与其他文语转换系统相比具有独特的音库压缩特点,使捷通华声TTS技术向嵌入式操作系统的移植(尤其是向PDA上的移植)具备先决条件。据市场调研及考证:捷通华声公司是目前最早掌握该技术,及最先提出在掌上电脑应用该技术的公司。该系统在2001年中关村电脑节上荣获十大"IT创新产品"。

  捷通华声TTS技术,以大规模真实录音的语音库为基础,增加音库压缩算法和音色变换算法形成核心技术。此核心技术与国内其他文语转换技术相比较,具有如下特点:

· 系统输出语音清晰度高。
· 系统输出可懂度高。
· 输出自然度基本与人正常说话持平。
· 音库大小可缩扩,小音库仅为1MB。

  正是因为捷通华声TTS具有以上的特点,使得捷通华声公司的TTS技术可以向嵌入式操作系统移植。特别是小音库的特点,使得在嵌入式操作系统下不会占用太大的资源。

  详细方案请参照捷通TTS在掌上电脑、信息家电等领域的解决方案

四、 捷通华声TTS(jTTS)在语音网站中的应用

  公司将捷通华声TTS技术和流媒体(Streaming Media)技术相结合,开发设计了专门针对语音网站的全面技术解决方案,并在国内率先推出了首家有声网站,为网站的"有声化"开创了先河。语音网站技术的推出,将使网站变得更加有声有色,吸引更多网络爱好者,使网络更加贴近广大用户的生活。捷通华声TTS技术在网站有声化方面,具有极广泛的应用前景,特别适合用于为网民提供新闻、财经、生活、文艺、 体育等各类有声的信息服务。

  详细方案请参照捷通华声语音网站解决方案

五、 捷通华声TTS(jTTS)在桌面产品中的应用

  利用捷通华声TTS技术可开发办公、教学、娱乐等智能多媒体应用软件,使这些软件增加了"说"的功能,丰富软件的内涵。目前公司利用TTS开发应用软件产品有:"录易汉语智能输入输出系统"、"捷通听霸"。在"录易汉语智能输入输出系统"中利用TTS做为智能输入后的语音校对,是国内第一家将TTS技术与智能输入技术相结合的厂商。在"捷通听霸"软件中利用语音合成技术实现了阅读电子文档、键盘输入时的即时语音校对、语音闹钟、卡通角色说话的功能。

  应用案例请参考《捷通听霸TB 3000》产品介绍

六、 成功案例

  捷通华声TTS技术自推出以来,已成功地在电信、证券等行业中得到了广泛的应用,并已进入台湾市场,其中典型的案例包括:

· 铁通-中铁综合信息服务网(CRIS-China Railway Information System)
· 赛迪呼叫中心
· 博时基金客户服务中心
· 台湾中华电信呼叫中心
· 天津移动呼叫中心
· 大连国泰君安证券平台系统
· 大连大开信证券平台系统
· 深圳市政府纪委电话咨询系统
· 福建省179平台
· 美国奥维平台系统