您当前的位置是:  首页 > 资讯 > 文章精选 >
 首页 > 资讯 > 文章精选 >

普强信息:智能语音在呼叫中心应用中的场景化及关键问题

2020-10-14 11:37:02   作者:   来源:CTI论坛   评论:0  点击:


  近年来,随着人工智能以及智能语音应用的飞速发展,各大公司及企业都在积极布局相关的技术应用及场景,“AI+行业”的商业化推广落地也进入了深水区。
  从事语音、人工智能行业近10年,有幸见证并参与了行业的发展,也对智能语音在实际场景中的应用及商业落地的难点有所体悟。下面是对智能语音技术的简单介绍,并对其在实际应用中应关注的核心问题提出一些我的思考。
  什么是智能语音技术,其发展如何?
  我们平时接触的任何语音相关应用(如微信语音、语音输入法、外呼机器人等),其实本质都是两大核心能力的体现——“音转字ASR”和“字转音TTS”。结合自然语言处理,理解并处理文本,即组成了人机交互的基本能力。
语音交互的基本模型
  智能语音应用基于三大要素:计算机算力、海量数据以及算法模型。随着过去多年的积累,不同类型的语音语料积累的足够多了,通过训练后的语音识别技术得以快速提升。相对10年前的情况来看,目前绝大部分语音识别技术的翻译准确率都已经很不错了,在噪音处理、语气语调、语义理解等方面均已大大提升,而最终在商业化上的能力差异体现关键在于两点:
  一,是否拥有核心的自主底层专利技术与能力?
  基于外接技术或引擎之上的智能语音商业化落地,终究是“无根之水“,难以持续的演化及进步。坦率的说,在这条赛道上竞争的厂商能拥有100%自主知识产权核心技术的并不多,在可预见的未来,这必将形成商业伙伴选择供应厂商的重要门槛。
  二,是否有足够多的商业落地场景和实施经验?
  智能语音在行业及商业上的落地需要脚踏实地做实际的事情,解决真实业务上的痛点。大部分客户需要的不仅仅是技术,而是一整套解决方案,优化改造业务流程、项目指导以及经验总结,交流分享。基于“高度重复构件的组合+部分的差异化定制”才是项目成败的关键。”造轮子“和”组装轮子“在客户的业务层面往往意味着极大的难度鸿沟与时间成本,而很多的友商伙伴们尚未真正意识这一点的重要性。
  智能语音场景化需要关注的问题
  就现在的实际情况来说,语音识别技术和应用产品如果希望有更好的表现,还是要像过去几年那样持续不断的去做数据训练:不同地域口音方言的训练、不同行业专业词汇的训练。
  既然数据和训练的投入是持续的,而且硬件及训练的成本也困扰着场景的落地,那么一味为了追求更高的转译准确率在成本及效率上是否值得,也是需要深入去思考的。在商业化落地的角度来说,供应商的准确率从85%-90%,与90%-95%的训练代价在成本和时间上的投入,与及客户期待是无法对等的,后者在训练周期与时间成本上很可能是前者的5-10倍,但收效甚微,而过度的追求准确率亦会严重拖慢项目上线的时间进度与人力投入。那么我们在实际应用中应该如何选择呢?
  我们的建议是从业务上不应过度的追求全文语音转译的准确率,而应该聚集于该场景下你所关注的具体诉求是什么,以场景应用为导向,关注实施的执行而不是过程。不是关注”全文识别率准不准“,而是”我要识别的那部分准不准“,因为绝大部分的真实业务场景下的语音应用均是限定在某个特定范围内。
  以语音质检为例,如果以模型质检点相关的文本来训练往往都能实现90%+,甚至更高的水平,而全文转译却很难达到,但这并不影响语音质检的实际应用,因为在该场景下,只要与质检点及模型相关的那部分语音识别准确率能达到即可为质检工作提供高效及有力的支撑。
  大部分质检的实际工作的真实关注点是所谓的“质检项”是否满足即可,全文的语音转译是否准确在该场景下是一种类似”白噪音“的存在,准确与否在大多数的情况下并不会影响该场景的真实应用,这就是一种”应用为先“的思考考量。
  因此,请不妨尝试着以这个思路来分析一下你手中的业务场景:“你想要识别的内容”应该不会很多很多,而自然语言中其实还含有与你希望利用的业务价值大量无关的,诸如无意义语气词,重复语句等。所以,语音识别并不一定需要非常高的准确率,它并不会实际阻碍你去利用该技术实现语音文本分析及探索业务价值。
  图像识别技术(OCR)技术就是一个很好的案例来说明这个问题,从普遍的识别准确性来看(类似于语音的全文转译准确率),OCR并不如大家想像中的智能,准确率亦没有想像中的高,通用性场景下基本都低于85%。以停车场车牌识别为例,该场景车牌识别上却非常普遍好用,准确度也高,就是利用了这种场景化下的针对训练(车牌识别所需的范围是相对可控的,要识别的对象也很有限——近场识别,字母、数字,车牌形状统一),同时抛弃了其他无用识别的干扰。
  这就是笔者上面所说的“应用为先”的思考思路,类似的例子还有很多,请大家不妨试试跳出思维的定式框框来重新思考您在实际应用中的智能语音应用场景。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业