首页>>厂商>>语音识别与合成>>科大讯飞

多语种语音合成助力数字奥运

2003/12/01

  为进一步提高语音合成的自然度、人性化等指标,科大讯飞在国家“863”计划支持下,承担了面向奥运的多语言信息服务系统中的重要课题——“面向奥运的多语种语音合成研究”项目,这一项目的承担将使语音合成技术更适用于奥运环境的应用。该项目大部分研发任务已经完成,目前已经处于项目的最后攻坚阶段,该项目的主要研发重点分为以下几个方面:

  1.对于语音合成引擎的应用程序接口和输入输出以及中间数据格式上,将提供一种跨平台的服务提供机制和具有良好扩展性的中间数据描述语言规范,使得遵循此规范的客户应用可以有效地在不同平台上使用语音合成服务。

  2.科大讯飞利用自己在多语种语音合成研究领域的优势,继续推进具有高稳定、高性能、高质量的多语种和混合语种合成引擎,使得语音合成服务可以满足中(含粤语)、英、日等不同语种的应用要求,另外针对奥运应用进行了优化,使在某些奥运应用领域可以达到完全和人语音相媲美的语音合成效果。

  3.科大讯飞在嵌入式环境下的语音合成技术取得突破,在小存储空间和计算资源需求下,可以实现比较高质量的合成语音。另外采用的分布式语音合成技术有机消除了语音合成中由于资源存储的限制而产生的对语音效果的影响。这就为语音合成的实际应用环境提供了多种可选的模式,使得在不同应用模式下都可以得到比较理想的语音合成服务。

  4.对于语音应用平台,智能服务接入技术、可扩展的标准数据交互技术的应用可以使用户专注于服务的结果上而不是如何去获取服务。另外大规模集群服务技术的采用,使超大规模应用和吞吐量的语音应用成为可能,有效解决了企业或电信级应用中由于多路并发以及大数据量交换产生的问题。

  在语音合成的下一步研究中,除了上述目标外,语音合成中的人性化研究是个重点研发目标。目前的语音合成系统虽然可以得到比较高自然度的合成语音,但是生成语音的风格比较单一。下一步的工作重点在于:在强大自然语言处理能力的指导下,能够根据当前文本的特点,使用与之相适合的风格以及语气语调来完成文本到语音的转换。

  另外,文本分析器可以按照当前文本的内容,给出文章中的重点段落、句子以及其它文本片断,即信息的焦点。这样,用户在使用语音合成服务时,不但能享受到高品质的合成语音服务,而且可以更容易地使用这种服务来获取所需的信息。另外声音特征的转换也是研究重点之一,用户可以用自己需要或是喜爱的声音特征作为目标,根据这种声音特征提供少量的声音样本,就可以使用语音合成服务中的相关智能工具,通过自适应的训练,使得合成的语音可以基本无损伤地转变为用户所期望的目标语音。


多语种语音合成示意图

科大讯飞供稿 原文刊登于塞迪网



相关链接:
讯飞畅言语音教具系统荣获“创新软件产品” 2009-09-08
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
“会说话”的显示屏提升居民小区信息服务水平 2009-09-07
讯飞语音助力太平人寿客服中心 2009-08-28
讯飞语音助力CDMA手机竞争终端市场 2009-08-14

分类信息:  语音合成TTS_与_语音识别ASR     热点专题_2008北京奥运会_文摘   新闻频道   技术_语音合成_新闻   技术_语音识别_新闻