您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

标贝科技情感合成新音色上线:7种情感模型以声传情

2022-01-21 08:30:13   作者:   来源:CTI论坛   评论:0  点击:


  如今,标准、清晰的AI合成语音已经深入日常生活,被广泛应用在语音助手、智能客服等领域。但如果你想在小说阅读或者影视配音场景下,使用同样「平铺直叙」的合成音色来演绎表达角色的性格特点、情绪起伏,那效果可能就要大打折扣了。不仅难以增强文本生动性和感染力,也难以为用户营造身临其境的沉浸感。
  那有人就会问了:
  AI合成声音能不能做到情感化配音,通过不同情绪来真实自然的展现人物的情感变化?
  在不同的段落情节里,AI合成声音能不能做到角色需要的例如哭泣、大笑、害怕等极具表现力的情绪需求?
  为了让AI合成声音也能「哭」会「笑」,像真人一样在语气、语调、情感等方面表现自己,增强与之交流的用户的融入感,标贝科技通过对声音感情的定义,推出情感合成方案,提供喜怒哀乐四个维度六种不同的情感表达,让声音更富有表现力,提升更多场景下的语音交互体验。
  自标贝情感合成推出以来,受到了广大用户的喜爱,成为名副其实的配音神器,特别是在有声阅读场景,每个故事、小说里都有大量的人物和情节,用户可以根据情节发展需要,搭配不同的情感声音,推动故事的转承起伏,让有声读物更有"人情味"。
  近年来,"虚拟偶像"和"元宇宙"爆火,为了满足更多细分场景应用,标贝科技再次推出二次元情感合成发音人--未眠小姐姐,打破虚拟偶像发音机械感强、无法场景化、需要人工反复调节声音参数导致不稳定等难题,让虚拟偶像的形象更为鲜活。

[高兴]
[生气]
[惊奇]
[悲伤]
[恐惧]
[厌恶]
  未眠小姐姐发出的喜、怒、哀、惧配音都是由标贝情感合成技术完成。用户可以明显感受到人物每一句声音情感的变化,当想要表达高兴的情绪时,合成声音会展现欢快喜悦的声音;表达悲伤的情绪时,则显现忧愁凄凉的声音;表达愤怒的情绪时,则是郁闷生气的声音;表达害怕的情绪时,则是慌张惊恐的声音。
  据标贝科技相关语音负责人介绍,如何让声音富有情感和表现力一直是语音合成技术的一大难点。为了保证合成语音的真实、自然,标贝情感合成依托于成熟的深度学习技术,通过强大的情感数据库,不断对合成模型进行优化训练,最终实现高音质、高自然度与多情感的声音表现,在韵律表现、声音层次感、情感表达等方面均接近真人表达,充分满足用户的个性化需求。
  标贝科技情感合成技术特色
  ●多情绪自然切换
  告别只会一个音调的 "机械音",标贝情感合成提供真实自然的开心、愤怒、悲伤、惊讶、恐惧、厌恶六种情绪下的声音,让AI机器和人一样能"哭"会"笑",以声传情,适用于不同情境下的不同语意表达。
  ●音色效果真实饱满
  标贝情感合成基于成熟的深度神经网络技术,并结合TTS3.0新一代高音质合成系统,使音色达到自然的抑扬顿挫、情感起伏,带给用户几近真人,流畅舒适的听觉体验。
  ●场景音色定制化
  标贝情感合成方案可以充分满足有声阅读、儿童教育、车载、泛娱乐等多场景应用需求。例如,针对有声阅读场景,标贝情感合成可以针对风格适配度、情感连续性、段落疲劳度进行更加契合的语速和语气,保证合成的效果足够接近真人且具有沉浸感;在泛娱乐虚拟偶像应用里,让虚拟人具备和真人一样的情感表现力,互动更加生动有趣。
  情感合成有效改变了传统的人机交互模式,实现人与机器人的情感交流。未来,随着AI技术对声音应用领域赋能进一步落地,更多智能化的娱乐生活场景必将到来。标贝科技将持续加大技术创新投入,不断优化完善情感合成方案,打造更有温度的情感声音,助力场景化应用升级。
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业