您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

标贝科技语音库|模仿童声、中文女声情感数据库

--分为喜、怒、哀、惊、惧、厌六种情感的表达

2020-04-24 10:45:51   作者:   来源:CTI论坛   评论:0  点击:


  语音合成技术的推广应用,对语音合成的质量提出了更高的要求。如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,也是语音合成研究领域所面临的一个难题。而情感语音库是语音合成技术的基础,也是决定语音合成效果的关键因素。
(点击试听情感效果)
  模仿童声—情感音库
  【模仿童声DB-6-情感音库】采集对象为标准普通话女声模仿儿童,听感活泼甜美。分为喜、怒、哀、惊、惧、厌六种情感的表达。录制环境为专业录音室和录音软件,录音环境和设备自始至终保持不变,录音环境的信噪比不低于35dB;单声道录音,用48KHz16比特采样频率、PCMWAV格式。录音语料为中文,利于各情感的表达,并对音节、音子、韵律等在有限语料基础上做了尽可能全面的覆盖。根据合成语音标注标准,依据发音人实际发音对音库进行文本音字校对、韵律层级标注。
  (点击试听情感效果)
  数据应用场景
  本语音数据库应用广泛,可用于以下方面:
  1.科研,可用于语音合成系统模型训练;
  2.有声读物;
  3.生活出行;
  3.智能科技;
  4.教育、娱乐等。
  技术参数

数据规格

数据内容

中文女声DB-6情感音库数据

录音语料

6种情感各2000句语料(喜、怒、哀、惊、惧、厌)

有效时长

14成品小时(12000句)

平均字数

15/

语言类型

标准普通话

发音人

女;20-30岁;声音温柔亲切

录音环境

声音采集环境为专业录音棚环境

1)        录音棚符合专业音库录制标准;

2)        录音环境和设备自始至终保持不变;

3)        录音环境的信噪比不低于35dB

录制工具

专业录音设备及录音软件

采样格式

无压缩PCM WAV格式,采样率为48KHz16bit

标注内容

中文音字标注、韵律标注、声韵母边界标注

标注格式

文本标注为.txt格式文档;边界标注为.interval格式文档

质量标准

1. 语音文件为48k 16bit wav格式,音色、音量、语速一致,无截幅;

2.标注文件字准率不低于99.8%

3.韵律无明显不合理标注错误;

4.音素边界错误大于10ms的比例小于1%;音节边界准确率大于98%.

存储方式

本地FTP存储

文件格式

音频文件:WAV 文本标注文件:TXT 边界标注文件:INTERVAL

数据脱敏

数据敏感项

产品应用

适用领域

科研、智能科技、生活、教育、娱乐等多领域应用

版权归属

版权所有者

标贝(北京)科技有限公司

  中文女声—情感音库
  【中文女声DB-6情感音库】采集对象为标准普通话女声,分为喜、怒、哀、惊、惧、厌六种情感的表达。录制环境为专业录音室和录音软件,录音环境和设备自始至终保持不变,录音环境的信噪比不低于35dB;单声道录音,用48KHz16比特采样频率、PCMWAV格式。录音语料为中文,利于各情感的表达,并对音节、音子、韵律等在有限语料基础上做了尽可能全面的覆盖。根据合成语音标注标准,依据发音人实际发音对音库进行文本音字校对、韵律层级标注、声韵母边界标注。
(点击试听情感效果)
  数据应用场景
  本语音数据库应用广泛,可用于以下方面:
  1.科研,可用于语音合成系统模型训练;
  2.有声读物;
  3.生活出行;
  3.智能科技;
  4.教育、娱乐等。
  技术参数

数据规格

数据内容

模仿童声DB-6情感音库数据

录音语料

6种情感各2000句语料

有效时长

14成品小时(12000句)

平均字数

15/

语言类型

标准普通话

发音人

女声模仿儿童,活泼甜美风格

录音环境

声音采集环境为专业录音棚环境

1)        录音棚符合专业音库录制标准;

2)        录音环境和设备自始至终保持不变;

3)        录音环境的信噪比不低于35dB

录制工具

专业录音设备及录音软件

采样格式

无压缩PCM WAV格式,采样率为48KHz16bit

标注内容

中文音字标注、韵律标注

标注格式

文本标注为.txt格式文档

质量标准

1.语音文件为48k 16bit wav格式,音色、音量、语速一致,无截幅;

2.标注文件字准率不低于99.8%

3.韵律无明显不合理标注错误。

存储方式

本地FTP存储

文件格式

音频文件:WAV 文本标注文件:TXT

数据脱敏

数据敏感项

产品应用

适用领域

科研、智能科技、生活、教育、娱乐等多领域应用

版权归属

版权所有者

标贝(北京)科技有限公司

 

【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

相关热词搜索: 标贝科技 语音合成 TTS

上一篇:Zoom并不想成为网红公司

下一篇:最后一页

专题

CTI论坛会员企业