您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

百度大脑UNIT3.0详解之语音语义一体化方案

2019-08-23 09:27:15   作者:   来源:CTI论坛   评论:0  点击:


  在电话客服场景里,用户和机器人交流的过程中,经常会出现沉默、打断机器人、噪声等情况,机器人在应对这些异常情况的时候,需要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈。而这些能力的获取与应用,也是企业智能对话项目落地过程中需要解决的难题之一。
  为此,UNIT带来了全新的语音语义一体化解决方案,帮助企业解决语音交互过程中的难题。
  【电话客服场景下语音语义一体化解决方案】
  语音语义一体化是针对电话客服对话场景的技术方案,可用于呼叫中心智能客服等业务。整个方案包含以下内容:
  (1)降低集成开发成本
  提供语音识别、语义理解、对话流程控制、知识库、语音合成的打通方案,全双工对话能力,一体化的部署方案,省去开发者对各环节自行调用、拼装的学习成本以及二次开发成本。
  (2)标准协议快速接入
  提供基于unimrcp框架开发的mrcpserver服务接入包,通过标准协议适配不同呼叫中心设备(主流的freeswitch、avaya、及基于mrcp标准协议自主研发的呼叫中心设备)。
  (3)场景定制服务提升效果
  方案中自带基于百度大脑呼叫中心下的通用ASR、语义纠错,打断策略,TTS模型,也可以基于开发者的业务场景,提供模型定制训练服务,定向提升业务准确率。
  (4)极少量开发,轻松实现对话流程
  提供Taskflow配置管理能力,开发者可在梳理业务流程后,通过少量代码快速配置对应的对话流程,后续可直接零代码在UNIT平台上进行拖拽式配置。
  【语音语义一体化方案解读】
  (1)语音识别ASR
  采用领先的百度语音技术,实时将音频流转识别出文本,并自动识别断句。
  (2)全双工对话能力
  建立通用机制,组织多模块协同工作,实现双通道数据(文本、事件信号)实时分发及处理。
  (3)纠错
  根据场景相关词汇生成纠错候选,利用GBDT模型对获选打分排序,最后通过beamsearch解码出最优纠错结果。
  (4)打断
  采用分类模型实现,判断是否满足打断条件,并下发打断信号,可支持用户自定义语料的模型训练。
  (5)静默及反问
  在设定时间内用户未回复情况下,机器人可自动反问。可支持用户对时间条件、机器人反问话术进行配置。
  (6)挂机、转人工
  定义标准事件信号:挂机、转人工。用户可通过配置、或简单二次开发完成判断条件的设定。
  (7)对话理解
  基于UNIT强大的语义理解能力,从实时文本中,解析用户意图。
  (8)对话逻辑引擎
  以可编程的方式构业务建对话逻辑。
  (9)语音合成TTS
  基于深度神经网络技术,提供高度拟人,流畅自然的语音合成服务,便于应用、设备开口说话,更具个性。
  【如何获取语音语义一体化能力】
  开发者可以进入UNIT官网——解决方案——语音语义一体化方案页面,了解技术详情并体验真实对话样例。https://ai.baidu.com/unit/v2/static/voice
  1、方案了解
  2、真实对话样例的体验
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业