科大讯飞以人为本,致力于创造人类信息时代信息获取和沟通的最佳方式。InterPhonic CE 2.2作为其InterPhonic系列的最新产品,在合成效果方面,除了继续提高中文与英文的合成效果之外,还在两者之间如何更加流畅的衔接,以及如何更加方便快捷的实现效果定制方面取得了显著的改进。除此之外,在系统的实用性、易用性等方面又有了进一步的提高,在此基础上,InterPhonic C&E2.2还新增了很多新的特性,如推出功能更加强大和完善的TTS Server Express语音合成服务器软件,并且首次加入了CSSML编辑器和TTS Doctor技术支持工具。
一、 技术改进
1. 产品效果方面
为了体现讯飞以人为本的宗旨,为了使用户感受到专业语音科技给他们带来的便利。InterPhonic CE v2.2在合成效果方面,主要增加了CE2.1系统中缺少的语气词合成、改进了短语、短句效果,同时改进了前端文本处理过程:
·语气词处理
语气的应用,例如“是吗?”“为什么呢?”“啊!”等。
在InterPhonic CE2.2以前的合成系统中不包含语气词的合成,对这些语气的处理都按照陈述语在一些语音应用中存在者一些非陈述气进行,这种处理影响了语音应用的效果。InterPhonic CE 2.2引进了语气词合成的处理,能够处理疑问、感叹等语气效果。这样使得这些生活中常用的语句真正做到人性化,让用户体验到亲切感。
·短语合成效果改进
InterPhonic CE 2.2在音库中补充了一定的短句语料,扩大短句语料的覆盖面,同时在前端文本分析中加入了短语语境的判断和处理。改进之后的系统在合成一些包含大量短句、短语的文本时效果上有比较明显的提升,例如人名、地名、短语合成。这种特性让系统的使用范围得到进一步加强。
·前端韵律算法改进
InterPhonic CE v2.2中通过对词类调整和未登录词算法的改进,提高了韵律树生成准确率,改进了合成自然度。可以使合成的声音更加和谐,愉悦听众的耳朵。
·多音字处理改进
新的多音字处理算法提高了多音字识别的准确率。减少了系统的误读率,更容易让用户接受。
2. 产品架构方面
·桌面版
InterPhonic CE 2.2系统提供了全新意义的桌面版,这种桌面版系统在保证与企业版相同的合成效果以外,有以下特点:
从InterPhonic CE v2.1版本以后,CSSML规范已经成为科大讯飞合成系统的一个重要部分,后期系统还将不断扩大CSSML规范的支持范围。CSSM具有兼容VoiceXML的严谨语法格式,并提供了功能丰富的标记。CSSML Editor提供了简单易用的CSSML可视化编辑环境,使得用户可以快速高效地生成CSSML标记文本。
InterPhonic CE 2.2系统保持处理CSSML格式的文本的特性。在后续的版本,讯飞依然会加强对CSMML规范的支持力度。用户可以对需要合成的文本进行编辑,将其编辑为CSSML格式的文本,对一些特殊用法、发音习惯进行单独标记,用以指导合成系统的合成,就可以提高合成效果、解决合成系统无法正确合成的多种问题。