您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

标贝科技推出「留声机」TTS方案 高还原、个性化声效提升交互意愿

2020-03-06 11:16:35   作者:   来源:CTI论坛   评论:0  点击:


  3月5日,标贝科技推出全新「留声机」,该方案具有高原度复刻效果,用户只需5分钟左右即可完成录制,训练过程全自动化处理,大约2小时后,即可拥有媲美原声声音的个性化模型,轻松实现文本转语音功能。该产品可应广泛用于车载交互、泛娱乐、智慧教育、智能家居、陪伴机器人等众多场景。
  据了解,本次标贝科技打造「留声机」产品方案,依托神经网络技术和迁移学习等技术,实现了很高的音色还原度,Mos值(语音质量的重要指标)接近4分,达到行业领先水平。用户可选择线上录音或线下上传语料包等形式完成留声机声音复刻,通过本地和云端调用的形式使用。
  标贝科技语音技术相关负责人表示,随着AI语音技术不断发展,智能语音市场将迎来爆发增长点。个性化、情感化是语音交互趋势。标贝科技推出的留声机方案,正是以个性化的AI技术为纽带,用有温度的声音,传递情感,让生活更美好。
  创新AI语音技术应用「留声机」打造高还原度复刻效果
  「亲情、个性化、有趣味的声音体验,与传统的、标准化的商用合成路线是完全不同的,具有门槛低、效果好、有亲切感等新的特点,可能会为我们打开一个全新的领域。个性化的声音,与用户的生活、工作、出行等重要场景结合,具有很大的想象空间。」标贝语音技术相关负责人说。
  标贝科技专注高质量与专业的AI语音合成与数据服务提供,以AI语音技术创新为增长力,拥有业内领先的语音技术,打造了包括多语种语音合成、离在线语音合成、多音色合成、本地化部署等在内的高音质语音方案,以及众多的声音IP、标贝悦读工具平台、声音复刻平台等。
  标贝本次推出「留声机」,基于attention语音合成系统,录制5分钟,10句话语音内容,系统经过录音采集、自动化训练系统,云授权服务及语音合成等系列步骤后,2小时左右实现声音复刻,MOS值4,兼顾合成效果与效率。
  据标贝技术相关负责人介绍,这一技术处理,相比标准化的TTS语音包,标贝个性化语音技术在情感合成上让声音更自然更真实。
  多场景触达「留声机」传递美好
  标贝「留声机」,经过声音录制→模型训练→声音应用等步骤,可广泛使用于应用于车载交互、泛娱乐、智慧教育、智能家居、陪伴机器人等众多场景。用户可在线录音通过API接口传输到标贝技术云后台;也可通过线下传输已有语料库,标贝通过API/SDK合成返回语音包。
  试想一下,家长忙碌无法陪伴孩子、生活起居专属语音助手提醒、远方亲人不在身边等情况,通过标贝「留声机」,用户均可定制个性化语音,将声音角色及关系体验与文本信息相互结合,获得一种前所未有的独特体验,从而为产品注入独特的个性化魅力。
  以儿童慧读教育产品—恐龙贝克App为例,该产品主打亲子陪伴教育,采用标贝留声机声音复刻功能,基于标贝提供的领先AI语音技术,结合海量故事内容文本,家长只需录制上传声音,即可获得复刻自己声音给孩子讲故事并实现分享,增强亲子熟悉度。
  据了解,恐龙贝克打造了包括超级飞侠—乐迪、孙悟空、龙妈妈等在内的多个AI卡通明星主播,配合经典卡通、国学启蒙、童话寓言、睡前故事等众多早教题材音频内容,寓教于乐,带给孩子美好童年。
  据悉,恐龙贝克最新版本iOS1.3.6与Android1.3.8,已上线各大安卓平台和iOS平台,家长用户可下载体验留声机功能,给孩子讲故事。
  随着AIOT与5G的不断融合,语音技术与场景结合度更紧密,个性化语音交互是必然趋势。而标贝留声机功能,把技术、情感与用户串联一起,生活无处不是爱,感受美好。未来,标贝科技将加大研发投入力度,携手合作伙伴一起,将留声机、标贝悦读等智能语音技术应用到更多场景中,带来前所未有的「视听盛宴」。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业