您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

新年上新|标贝科技自学习引擎助力语音识别更精确

2022-01-07 16:58:27   作者:   来源:CTI论坛   评论:0  点击:


  每到岁末年初,总是职场人最忙碌的时候。各种名目繁多的年终总结会接踵而来,小组分享会、部门总结会、公司全员会......参会不可怕,可怕的是,这次轮到谁做会议纪要!要知道这些会议不仅持续时间长,参与人数多,会议录音里很多话根本听不清啊!
  但机智如小贝,提前从产品运营小姐姐那里弄来了自家语音识别SVIP权限,无论是线下会议、视频会议,还是微信电话等,再长的录音语音文件,一键转换,大份大份的会议纪要新鲜出炉,简直是强迫症的福音有木有!
  其实在人工智能飞速发展的今天,随着数据量增加、计算能力增强以及深度学习理论技术的发展,语音识别准确率不断提升,应用领域不断拓宽。不止是会议录音文件转写,语音识别早就成为很多设备的标配。例如,我们可以对着手机说“siri,打个电话给老妈”,又或是“小度小度,放首歌”等等。
  虽然目前语音识别对于通用场景的语音识别效果较好。但是在一些特定和垂直的应用领域,对于一些专有名字、专业术语、特定的命名实体等识别的准确率却不尽人意。例如游戏中有很多专属的说法,“冷静,不要莽”,“不服来Sala(Solo)啊,父子局”、“咱们家没有打野吗”,这些特定的词汇仅使用通用语音识别功能很难将其准确识别。
  面对这些语音识别难题,标贝科技强大的算法团队自主研发ASR自学习引擎,推出“自学习个性化模型”和“热词”的功能,以提高专属场景下语音识别准确率。
  01. 标贝科技语音识别自学习工具是什么?
  目前市场上供应商大多都是提供通用领域的语音识别服务,对应的语言模型为基础语言模型。如果用户需要识别的语音内容不在现有的模型范围内,就会出现部分词汇默认识别效果不好。
  通过标贝科技“自学习工具”,在语音识别控制台上传专有领域或行业积累的文本数据,通过对这些训练语料做模型训练,来生成自己的自学习个性化模型和热词模型,可以有效提高专有领域场景下的语音识别准确率,尤其是对专有名词和文本中的高频词汇,有较好的优化效果。
  热词:通过标贝开放平台-【热词】功能,将特有的人名、地名、公司名、领域专有词汇(医疗、建筑、金融、保险等领域)上传并保存发布,秒级生效。
  个性化模型:通过标贝开放平台-【个性化模型】功能,将专有领域或行业积累的具有特点的文本数据上传并保存发布,约5~20分钟后生效。
  02. 标贝科技语音识别自学习工具有什么优势?
  便捷接入
  标贝科技自学习工具控制台可实现一键配置文本,通过识别接口上传文本参数即可快速生成识别效果,无需更多投入。
  快速生效
  通过标贝科技自学习工具,只需要上传专有领域的文本信息,热词保存秒级生效,开箱即用,个性化模型最快5分钟即可训练完成,快速响应用户业务。
  全领域覆盖
  标贝科技自学习工具面向全领域的自学习训练优化,渗透各垂直行业的业务信息即添加即影响,真正打造行业内可快速落地的语音识别技术。
  03. 怎么使用标贝科技语音识别自学习工具?
  (1)前往标贝开放平台创建应用,并进入语音识别服务-自学习工具;
  (2)进入自学习工具-热词页面,将专有领域和行业积累的文本数据整理保存为UTF-8编码的 txt 文件,点击“新增热词组”,进行热词添加;
  (3)获取热词组id,识别调用,测试效果。 随着语音技术与智能手机、平板电脑等电子产品芯片集成的深入发展,中国智能语音市场规模将继续保持稳步扩张态势。
  语音识别作为人机交互的入口,应用场景会更加广泛。标贝科技将持续加码研发投入,推动语音识别服务继续优化升级,创造更加智能的语音交互体验。
  目前标贝科技语音识别【自学习工具】已经在官网和标贝开放平台上线,免费对客户开放。欢迎登录标贝开放平台体验。
  (1)标贝科技官网:https://www.data-baker.com
  (2)标贝开放平台:https://ai.data-baker.com/#/index?source=gzh001
 

【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业