您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

标贝科技推出四川话语音合成服务,全力助推方言定制解决方案

2021-06-03 10:24:17   作者:   来源:CTI论坛   评论:0  点击:


“他是个落教的人,不弯酸。”
“我巴郎不得去上班”
“你啷个晓得噻”
 …………
  当你朗读上面的句子时,有没有自带音调,并不自觉拉长了语感?这种颇具感染力且最能直观表述情感的四川话,已然成为“流行”符号。无论是RAP歌曲,还是搞笑段子,四川话均可作为内容创作元素,引来大批“粉丝”围观学习。
  而四川话普及和方言保护问题早在2013年就已是当地重点研究项目。但如果你不是local,对四川话也没有过多了解的话,还是很容易怀疑自己是不是听了外语。
  为了延续四川话中巴蜀文化与情感传承,让更多的人能够感受汉语西南官话文化的魅力,也为了更好地服务四川当地乃至世界各地的四川话相关使用人群,6月3日,标贝科技精心打造并推出四川话语音合成技术。
  01 四川话语音合成技术难点
  四川话语音合成技术在行业内已经较为普遍,标贝科技选择此时公开并发布,主要是对于其相关技术精进度的升级与把控。在四川话语音合成方面,进行了更多维度的技术开发,较普通话语音合成来说,难度提升也比较大。
  首先,四川话相比普通话有声韵母发音更加复杂,比如声母无卷舌音zh、ch、sh、r不卷舌,增加了舌面鼻浊音n、舌根鼻浊音。这样的发音方式,在一定程度上增加了语音数据标注和技术开发重构取舍的难度。
  其次,四川话声调值无高升调,各个地区调值的发音也不是很相同,在语音采集及标注中,均增加了样本数量,包括口语化的语料。同时在标准四川话选择上,增加了技术开发的精确度及地道川语的韵律。
  再者,四川话在构词法方面,跟普通话对比,构词法上显着的不同是名词和动词的重叠式,即名词能够重叠,动词一般不能重叠。
  面对以上问题及四川话语音合成发展现状,标贝科技在融合更多采集样本量及标注精确度上,技术开发进行一一突破,做出了更高质量的四川话语音合成效果。
  02 标贝科技四川话语音合成亮点
  在标贝科技最终的四川话语音合成音频中,其发音准确、音调标准,合成音色拟真人、无机械音,长句表述自然流畅、无卡顿,韵律停顿自然流畅。整体的技术都是基于标贝升级版本TTS3.0的框架,输出的音质效果更清晰稳定。
  四川话语音合成,其应用场景也较为广泛。包括:川语客服、语音播报、影视娱乐、硬件设备等。高标准的四川话语音,会为大家带来不一样的感受。
  正式上线四川话语音合成技术后,标贝科技将在其官网、标贝AI语音工坊小程序、标贝开放平台、标贝悦读等设置体验区和增加产品入口,欢迎川音应用厂商、各企业及开发者体验下载。
  而在推出四川话语音合成后,标贝科技声音库也新增“一员”,与粤语语音合成、台湾话语音合成等形成方言版声音定制库,助力更多方言场景落地。
  03 标贝科技个性化声音定制解决方案
  除了普通话语音合成、方言语音合成技术及解决方案外,标贝科技还有个性化声音定制、声音克隆(声音复刻)等解决方案,满足更多客户声音需求。
  声音定制方面,标贝科技会根据不同音色、不同发音的声音,采集不同领域的特定语料,对语料进行“设计”;之后,技术专家会对发音人的说话风格、语调和停顿方式进行指导,完成声音的“采集”;再对声音的音字、韵律和音节音素进行“标注”;从文本、韵律层级预测、声学参数和声码器方面进行合成。
  声音复刻「留声机」技术解决方案,客户只需录制5分钟,10句话语音内容,当在机器录入任意文本后,就能播放出和用户声音几乎完全一致的“人造声”。目前在声音相似度、自然度等指标上均达到行业领先水平,MOS(语音质量的重要指标)接近4分,且音色高保真,真实还原录音人语气、语调、情感,清晰自然。
  标贝科技作为国内领先的人工智能语音技术、产品和数据服务提供商,一直在AI语音交互技术及高精度数据采标处理技术上进行创新。截止目前,语音合成、声音复刻等解决方案已经帮助客户实现多个场景落地。其包括:有声阅读、智能客服、智慧金融、AI教育、泛娱乐、自动驾驶等众多领域。而此次推出的四川话语音合成技术服务,也将助力更多开发者实现方言及个性化声音解决方案的落地。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业