首页   新闻  文摘   行业   产品  技术  厂商  标准  BBS  导航  搜索
呼叫中心 | CRM | 统一通信 | 企业通信 | VoIP | 视像通讯 | 语音应用 | 热点专题

首页>>厂商>>语音识别与合成>> 捷通华声

捷通华声语音合成(jTTS)技术介绍及解决方案

2002/09/01

一、 捷通华声TTS(jTTS)介绍

1. 捷通华声TTS技术文语转换的基本原理

捷通TTS技术文语转换的基本结构:

  • 基本结构:

  • 语言学处理

  语言学处理在文语转换系统中起着重要的作用,他主要是模拟人对自然语言的理解过程--文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。

  • 韵律处理

  韵律处理的目的是为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然悦耳。

  • 声学处理

  声学处理的主要功能是根据前两部分处理结果的要求输出语音,即合成语音。

2. 捷通华声TTS的特点

  • 捷通华声的TTS技术(jTTS),是具有自我版权的TTS技术,以大规模真实录音的语音库为基础,采用多样本、不等长言语段波形拼接技术,增加音库压缩算法和音色变换算法形成核心技术,发音清晰流利、自然度高。
  • 捷通华声TTS在文本到语音的转换过程中不是对文字到语音的简单映射,还包括了对文字的理解,以及对语音的韵律处理。
  • 捷通华声通过研究汉语的声调、重音、语调的声学特点,设计了重音和语调的模拟。
  • 捷通华声TTS在韵律规则方面,采用统计和规则相结合的方法,研究了汉语韵律规则并进行了一定的韵律模拟工作,以韵律层级的匹配作为选音段的基本原则。
  • 捷通华声TTS提供中英文混读功能,嵌入中文内部的常用单词的音色与中文保持一致,更加自然流畅。
  • 捷通华声TTS的音库大小可调节,能提供从PC、语音卡到掌上电脑TTS技术的全面解决方案。可以将音库和程序压缩到共1.5M的水平,实现了在嵌入式系统上的应用。
  • 提供捷通华声TTS开发工具包(jTTS SDK),可以合成到声卡,合成到文件,直接获取语音流,支持多线程操作,支持GBK、BIG5字符集的文本阅读。 其中音库大小可调节的特点是捷通华声TTS能够移植到掌上电脑等嵌入式设备的关键特点,也是捷通华声TTS独具的优点。
  • 支持多种操作系统,如WindowsNT/2000/XP、Linux及各种嵌入式操作系统。

  捷通华声公司在2001年7月完成了最新版本的捷通华声TTS核心。新版本基于大规模真实录音的语音库,音库提供的样本多,选音范围大,可选择到更匹配的发音,另外,在选音和拼接时将超越了音节的层次,能够进行词甚至短句层次的拼接。因此,在自然度、可懂度方面捷通华声新TTS具有较大的提高。再加上英文单词的音色与中文保持一致,可支持GBK字库中的所有字符的发音,新的捷通华声TTS技术的合成的语音几乎达到自然说话的效果。

3. 捷通华声TTS的进一步发展方向

  捷通华声TTS将在下面几个方向发展:

  • 进一步提高语音合成的质量,达到更加流利和自然的程度。
  • 进一步研究音色的转换功能,使得TTS技术可以实现各种音色(包括不同性别、不同年龄、不同发音特征等的语音输出。
  • 为各行业提供TTS核心技术和解决方案,特别是CTI行业和嵌入式系统领域。
  • 将TTS技术移植到其它操作系统,例如Unix,移植到其它嵌入式操作系统,例如Palm OS, HOPEN等;考虑TTS技术的硬件实现。
  • 将TTS技术和其它各种新技术相结合,并在更为广泛的范围内推广和应用TTS技术。 捷通华声TTS技术可以普遍应用在计算机和通讯领域的许多方面。捷通华声公司将努力成为一个TTS核心技术的供应商,并在下列领域广泛应用TTS技术,进一步为TTS技术的应用做出自己的贡献。

二、 捷通华声TTS技术(jTTS)在CTI领域中的应用

  捷通华声TTS技术在CTI行业中的应用提供三种解决方案:本地接口调用方案、语音服务器方案、离线合成方案。

1. 捷通华声TTS本地接口调用方案(jTTS SDK)

方案概论:

  本地接口调用方案提供捷通华声TTS开发工具包(jTTS-SDK)可使用户在其开发的系统中加入语音合成的功能。jTTS-SDK是基于Win32(32位Windows环境,包括Windows95/98/2000/NT)平台下的开发工具包,因此这种方案要求使用方的声讯服务系统所运行的是32 位Windows环境的服务器,并且需要对使用方系统进行部分程序的改造。该方案适用于要求使用方具有二次开发能力的集成和应用商。


本地接口调用方案架构图

2. 捷通华声TTS语音服务器方案 (jTTS Service )

方案概论:

  语音服务器方案直接提供装载有捷通华声TTS语音服务系统的高性能的服务器,它与现有的声讯服务相平行,接受其指令和文字数据流,合成产生语音数据流返给原系统,适用于电信、大型企业CTI系统及声讯台改造、升级。


语音服务器方案架构图

技术优势:

1. 降低了客户端机器的配置需求。
2. 通过TCP/IP协议实现了跨操作系统的语音合成服务功能,可以满足非Win32平台的需求。
3. 对于服务规模较大的系统可实现语音服务器的分布式工作方式,对客户端的请求自动调度,平衡负载,以达到更高的性能。

应用领域:

  采用语音服务器方案可在不改变现有服务系统的条件下,平行地建立捷通华声TTS语音服务器,安全、高效率地将原来的文本服务扩大为文本-语音同时服务,是大型、专业级的语音服务解决方案,并可跨平台实现。捷通华声TTS语音服务器方案可服务于160、168等声讯台、UMS统一信息服务系统、呼叫中心、语音邮件商、WAP网站、进行网上播音的.com公司等。

3. 捷通华声TTS离线合成方案(jTTS Builder)

方案概论:

  捷通华声TTS离线合成方案提供离线合成工具,这是基于Microsoft Windows 95/98/NT/2000的独立应用程序,可提供离线的语音合成服务,批量地将文字转换为语音数据文件,适用于海量信息、相对稳定或不要求实时转化的声讯服务场合,可以直接替代传统的录音方法,对原有系统完全无需改造,节省人力,提高效率。


离线合成方案系统架构图

三、 捷通华声TTS(jTTS)在嵌入式操作系统下的应用

  捷通华声公司的TTS技术与其他文语转换系统相比具有独特的音库压缩特点,使捷通华声TTS技术向嵌入式操作系统的移植(尤其是向PDA上的移植)具备先决条件。据市场调研及考证:捷通华声公司是目前最早掌握该技术,及最先提出在掌上电脑应用该技术的公司。该系统在2001年中关村电脑节上荣获十大"IT创新产品"。

  捷通华声TTS技术,以大规模真实录音的语音库为基础,增加音库压缩算法和音色变换算法形成核心技术。此核心技术与国内其他文语转换技术相比较,具有如下特点:

· 系统输出语音清晰度高。
· 系统输出可懂度高。
· 输出自然度基本与人正常说话持平。
· 音库大小可缩扩,小音库仅为1MB。

  正是因为捷通华声TTS具有以上的特点,使得捷通华声公司的TTS技术可以向嵌入式操作系统移植。特别是小音库的特点,使得在嵌入式操作系统下不会占用太大的资源。

  详细方案请参照捷通TTS在掌上电脑、信息家电等领域的解决方案

四、 捷通华声TTS(jTTS)在语音网站中的应用

  公司将捷通华声TTS技术和流媒体(Streaming Media)技术相结合,开发设计了专门针对语音网站的全面技术解决方案,并在国内率先推出了首家有声网站,为网站的"有声化"开创了先河。语音网站技术的推出,将使网站变得更加有声有色,吸引更多网络爱好者,使网络更加贴近广大用户的生活。捷通华声TTS技术在网站有声化方面,具有极广泛的应用前景,特别适合用于为网民提供新闻、财经、生活、文艺、 体育等各类有声的信息服务。

  详细方案请参照捷通华声语音网站解决方案

五、 捷通华声TTS(jTTS)在桌面产品中的应用

  利用捷通华声TTS技术可开发办公、教学、娱乐等智能多媒体应用软件,使这些软件增加了"说"的功能,丰富软件的内涵。目前公司利用TTS开发应用软件产品有:"录易汉语智能输入输出系统"、"捷通听霸"。在"录易汉语智能输入输出系统"中利用TTS做为智能输入后的语音校对,是国内第一家将TTS技术与智能输入技术相结合的厂商。在"捷通听霸"软件中利用语音合成技术实现了阅读电子文档、键盘输入时的即时语音校对、语音闹钟、卡通角色说话的功能。

  应用案例请参考《捷通听霸TB 3000》产品介绍

六、 成功案例

  捷通华声TTS技术自推出以来,已成功地在电信、证券等行业中得到了广泛的应用,并已进入台湾市场,其中典型的案例包括:

· 铁通-中铁综合信息服务网(CRIS-China Railway Information System)
· 赛迪呼叫中心
· 博时基金客户服务中心
· 台湾中华电信呼叫中心
· 天津移动呼叫中心
· 大连国泰君安证券平台系统
· 大连大开信证券平台系统
· 深圳市政府纪委电话咨询系统
· 福建省179平台
· 美国奥维平台系统



        


发表评论


  ·Aspect中规模企业联络中心解决方案研讨会 [7月16-24日 北京 上海]
  ·“呼动中国”:东进技术多媒体呼叫中心招募增值渠道合作伙伴
  ·招聘:上海宝东 东进通讯 亿迅(中国) 亿博科创 信普飞科 正音科技

  ·《2007中国企业通信(呼叫中心)市场研究报告》出版  
  ·最新资料:《企业呼叫中心建设指南》 《企业通信案例及方案大全》
  ·免费索取:《多媒体交换机资料》   《IP、无线和视频方案》

  ·新太科技成功中标康佳集团呼叫中心项目
  ·讯飞新一代语音合成系统Interphonic5.0强势推出
  ·IP分布式呼叫中心在各行业应用

            


企业会员
恒生电子 恒融数码 Nuance
一维天地 新太科技 敏迪网络
加入办法 ->





CTI论坛推荐
·三友亚星:上海红孩子电话营销和客服系统
·什么是IP分布式呼叫中心
·北京网音:助力企业通讯系统平滑升级
·讯飞ViviVoice开启语音娱乐新时代(TTS演示)
·东进技术:Seegoe Enterprise/Office呼叫中心
·HXD09可编程智能语音交换机
·大幅度砍掉大容量呼叫中心的成本
·新太科技成功中标康佳集团呼叫中心项目
   
相关链接
CTI论坛周刊 融合通信专栏
行业案例汇编 免费发布新闻
管理员俱乐部 服务与营销论坛

热 点 专 栏
|业界新闻|论坛文摘|行业应用|产品展示|技术天地|厂商汇总|免责声明|咨询服务|公司简介|联系方法|广告服务|企业会员|

编辑投稿信箱      如何查找厂商联系方法

电话:010-82012787,82079677   传真:010-62041062
呼叫中心建设及运营管理咨询服务:优胜资讯(010)87768798 87768726