您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

标贝科技情感合成技术,打造多场景AI语音落地实践

2020-07-23 15:00:42   作者:   来源:CTI论坛   评论:0  点击:


  《声临其境》节目里,张含韵用不同情绪模仿皮卡丘的超萌配音,让人印象深刻。网友坦言,"太可爱了!真想把张含韵抱回家。"
  谁的童年记忆里没有一只皮卡丘呢?
  这个拥有软萌叫声,萌萌哒外表的黄色大老鼠,可谓征服了无数观众,不但被周深、杨超越、宋茜等明星纷纷模仿,化身明星界的动漫宠儿,就连很多抖音玩家也喜欢为皮卡丘配音,不同的情感表达,尽显灵动可爱。
  相信大家也看过不少皮卡丘声音配音秀,如果换成人工智能,让 AI 用不同情感的声音来演绎皮卡丘的叫声,会是怎样的 "皮卡~皮卡" 呢?
  让我们来一同感受下~
 
(以上视频仅用于情感合成技术应用示意)
  影视来源:《皮卡丘大侦探》
  bgm | Pen Pineapple Apple Pen -DJ Rikituki
  视频中皮卡丘所发出的喜、怒、哀、惧配音都是由人工智能完成。可以明显感受到 AI 版皮卡丘 "说" 的每一句声音情感的变化,当想要表达高兴的情绪时,AI 则会展现欢快喜悦的声音;表达悲伤的情绪时,则显现忧愁凄凉的声音;表达愤怒的情绪时,则是郁闷生气的声音;表达害怕的情绪时,则是慌张惊恐的声音。
  这背后运用的技术就是 AI 情感合成技术。
  什么是情感合成?可以简单理解为,赋予机器语音情感与表现力,让机器具有人情味。我们可以想象一下,当我们与智能家具、车载、机器人、语音助手等智能体交流时,它不仅说话效果接近真人,而且富有情感。
  比如它可以用高兴的声音、悲伤等不同情绪起伏的声音来和你交流,你会明显感觉到,它今天心情挺不错,它好像微微有些不高兴,你还会觉得它是冷冰冰的机器吗?会不会更加愿意和这些人工智能进一步互动与相处呢?
  上述皮卡丘配音视频中,为大家展示的是情感合成技术在泛娱乐场景下的应用,如今短视频的火爆,更是推动了 UGC+ 时代的到来,当大量的内容制作需要配音完成时,有许多创作者开始将语音合成结合到内容创作中,高效提高内容制作效率,当语音具有一定情感表达能力后,内容也会变得更加生动和有趣。
  此外,虚拟形象近年来发展势头也逐渐迅猛,例如虚拟主持人、虚拟偶像,能够具有一定的情感表现能力,相信也会为虚拟形象市场带来很大的改变。
  另外,有声读物的广泛应用,由于故事、小说等文本素材包含大量角色人物,通过不同情感合成声音配合文本内容,在展现文学小说人物的的特点同时,给用户营造引人入胜沉浸感体验。比如下面这段故事《老鼠去海边》。
  让我们来听下 AI 用不同情感阅读:
  
  (以上文本阅读仅用于情感合成技术应用示意)
  不同的情感表达是存在明显差别的,我们能从声音里明显感受到情绪的变化。
  目前,标贝科技已推出可商业化落地的 AI情感合成技术解决方案,主打高音质、高自然度与多情感,可以呈现出高兴、愤怒、恐惧、哀叹、悲伤等六大经典情感类型,支持客户定制化情感语音合成解决方案需求。
  情感合成作为一项技术,离不开神经网络的三要素:算法、算力和数据,其中数据是打造自然、高表现力的声音效果重要臂力之一。
  在数据方面,标贝拥有包括识别自有库,合成自有库,歌曲音库、明星 IP 音库、以及方言音库等在内的多种不同类型的语音数据库,语音数据时长累计超过十万小时,这些数据有很多应用到了我们的情感合成实践当中。(点击了解标贝情感数据库)
  标贝科技致力于为智能客服、智能机器人、智能家居、车载导航、有声读物等相关应用场景提供更加优质的语音技术服务,为用户提供高质量的智能交互体验。
  欢迎对以上情感合成技术解决方案感兴趣的行业伙伴与我们联系marketing@data-baker.com
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业