您当前的位置是:  首页 > 新闻 > 文章精选 >
 首页 > 新闻 > 文章精选 >

云之讯:AI+通讯,智能通讯服务平台助力客服产业升级

2018-10-23 16:31:19   作者:   来源:CTI论坛   评论:0  点击:


  由CTI论坛(www.ctiforum.com)主办的2018中国客户体验创新大会于2018年10月18日在深圳益田威斯汀酒店盛大开幕。本次会议以“人工智能技术引领客服行业迭代升级”为主题。云之讯语音业务部总经理刘泽阳应邀出席此次会议并发表题为《AI+通讯,智能通讯服务平台助力客服产业升级》的主题演讲。在呼叫中心通讯技术日趋成熟的今天,人工智能给通讯服务注入了新的活力,将带来更加丰富的通讯服务场景与应用,提升客服呼叫中心业务上的体验,优化服务效率。云之讯通过十余年来致力于通讯领域产品技术探索,通过实时捕捉通信媒体流,实现语义理解、语义分析,进而与客户实现基于人工智能的对话,广泛应用在调查问卷、用户回访等场景,而AI在通讯安全上同样表现优异,实现给客户提供智能服务,大幅提升客户服务体验。

刘泽阳,云之讯语音业务部总经理
▲演讲PPT下载,pdf格式
  刘泽阳:各位下午好!很高兴代表云之讯来参加CTI论坛主办的交流活动,我接到这个主题之后,就在想给大家分享一些什么样的内容,能让大家有所收获,而不仅仅是作为一个乙方来推广产品和应用。今天我想给大家分享,云之讯在探索人工智能、大数据过程中,遇到的问题和收获,以及人工智能这个技术在呼叫中心领域有哪些可以实现的比较好的应用。“AI+通讯,智能通讯服务平台助力客服产业升级”是我此次分享的主题,下面我给大家汇报一下。
  云之讯一直以来在通信行业做深根,后来随着市场的逐步变革,云之讯也转型到企业通讯,向这个行业领域去探索、去进军。云之讯基于公司在通信行业的积累,以及在云计算、大数据方面的探索,我们定义自己为通信能力服务平台,这个平台其实是融合了人工智能、大数据、融合了安全管控中心,来帮助客户解决他们的问题。
  在基础技术的应用上,如语音合成、语音识别、大数据分析,这几个在时下都非常火热的人工智能词汇,目前,我们已经具备。而这些技术的应用,会产生怎样的火花?通过在通信平台上的集成,我们其实有4个主要应用,第一个是在2018年非常火爆的智能客服机器人,其次是智能通知、智能安全管理,最后一个是智能码号状态监测,就像刚才刘博涛刘总(电话邦副总裁)讲到的,通过号码的标识,我们可以提升在呼叫过程中的效率。而我们的目标和愿景是把这些能力开放给全社会的呼叫中心企业。
  在多年的发展过程中,我们服务了很多标杆企业,包括顶尖的互联网巨头、保险、银行,以及证券、物流这些行业企业,他们在呼叫中心方面都与我们有广泛的合作。
  下面分享一下我们对现在的AI包括通讯这个行业的看法和思考。之前在探索AI的过程中,我们总觉得它是一个玩具,不能商用,而随着AI技术的进步,尤其是在2017年底-2018年的发展过程中,它从一个高高在上的技术逐渐走上了商业化的道路。从2018年开始,AI在呼叫中心这个行业的商业化进展是非常迅速的,我们看到在整个行业内出现了几百家AI外呼企业,而反过来,商业化也是可以驱动技术的成长和前进的。我们在跟客户交流的时候,几乎所有的客户都愿意去尝试,看看这个机器人可以带来什么样的效果。然而在这个过程中我们也发现了一些问题,在座都是行业内的,业内在试用过之后觉得它好像未必可以达到我们理想的状态。那人工智能+通讯到底有没有用呢?答案是肯定的,但是我们要选择它适合的场景,它能做什么,我们就让它做什么。随着技术的不断革新,这种情况会变得更好。
  目前,它所应用的行业有教育、汽车、金融、房产等,客户服务和营销外呼,都在这些行业中。我们认为现在呼叫中心产业迎来了第五代产业升级,第一代呼叫中心它可能基于传统硬件,像华为,是传统硬件的一个代表,可能在2010年之前以传统硬件为主。后面的软件+硬件,我们称之为第二代呼叫中心。第三代是纯软件的时代,在2010年的时候,纯软件的呼叫中心,由于受限于一些技术上的瓶颈,它在通话质量以及各种能力上并没有达到当时的商用水平,但是随着软件化的逐渐提升,有了第三代。第四代是多媒体,第五代是人工智能呼叫中心。那第五代呼叫中心需要具备哪些能力呢?有大数据的能力、业务应用的能力以及AI的能力。在这几方面的能力,云之讯都有一些积累,并且可以把这些服务提供出来。其实人工智能在语音识别,在文本,在语音转文字,在智能识别,在知识图谱还有图片识别各个方面都有了阶段性的突破,AI将会引领第五代呼叫中心的产业升级。
  下面我给大家介绍一下,在这样的大背景下,人工智能和通讯结合的具体应用场景,就是我们前面讲到的4个应用场景。
  第一个是智能对话机器人的场景,在这个工程中,有很多同仁都已经体验过这个机器人,它会面临很多问题,比如说训练过程复杂。我了解到像某银行的信用卡中心,它做智能客服的时候,有12000个需要完成的问题,每一个问题有5100个相似的,基本需要半年的时间去训练,如果不经过训练好像未必能达到我们想要的效果。因为有一句话讲得比较有道理:人工智能有多少产品,产品就会有多少智能。第二个影像效果,语音识别的技术,我接触过很多这种做语音识别的,像传统的厂家,其实会有一个问题,他们在做实体机器人的时候,如银行的实体机器人、医院的实体机器人,还有电话机器人,他们遇到的最大的问题是,语音识别准确率并没有达到要求,很多时候会受到环境噪声的影响。什么时候你打断,什么时候你不打断呢?环境噪声该把它识别到什么,降噪要降到什么程度,还有反应速度慢,这些都是行业中普遍遇到的问题。
  云之讯是怎么思考这些问题的呢?其实在智能机器人,语音识别,还有可视化的流程设计中,我们可以把业务的训练从业务端转化到客户这一侧。我们推出了自己的核心模块,用模块组成,尽可能缓解我们面临的问题。
  下面主要介绍跟大家一下在这些模块中我们遇到的像NLU意图识别,我们是怎么解决的。在人工智能这个领域,我们会跟很多做语音识别的公司交流,比如说像追一,像三角兽,我们发现传统的AI大部分是应用于超大型的客户,他们会投入很长的时间去做机器人的尝试。但是现在社会上仅仅是他们需要吗?其实有很多中型企业或者小型企业也面临这样的诉求。我们之前在NLU遇到的主要问题,这些传统的厂商更多是在单一的行业做深耕,将机器人训练成非常聪明的状态。假设我要提供产品化的服务,我怎么办?云之讯就做了这样一个NLU意图分层的逻辑,这个比较好理解,我们针对各个不同的行业,每个场景都有一个自己全行业的通用数据库,它是基于很丰富的语料训练和积累,经过长期的沉淀,获得的一个行业通用数据库。针对每一个数据库,假设他进来的话,我把他作为一个意图分层中的分支,它的FAQ是怎么样的,对于同样一个词的理解,它的意图一定是要分区块。然后再下一层去区分具体的客户分层,这样其实可以大大地减少企业做训练的周期,给企业做成一个产品化的服务,而非项目式的服务。我们经过了几层,在多轮对话的时候看有没有上下轮关联,是基于关键字,还有搜索近似匹配这两个模块。统计模型是基于复杂场景。最后是实现意图的分化和匹配,到各个不同行业的意图库里面。我们逐步优化每一个库,形成一个强大的NLU知识储备,有知识储备这个机器人才能成为智能可用的机器人。NLU是逐步强大的,公共库越强,我们的产品能力就越强。
  这是我们服务保险客户的场景--保险续费,有很多保险公司都很在意这个成本。我们当时跟保险客户聊的时候,他们已经把续费环节从人工客服的环节去掉了,这主要是出于节省成本的考虑。我们跟他们聊了机器人之后,他们发现在续费的场景是可以用得到的。在续费场景,机器人会查询在一个月内即将到期的客户,比如说车险到期了需要续费,可能客户自己不会想到这一点。然后机器人就需要根据客户信息合成话术,自动提醒客户应缴费信息,如某某先生,你的保费已到期,现在需要帮您代扣,您是否接受这样的代扣。在这个过程中,客户需要有全部的名字,并且保存录音,作为日后查证的一个依据。第三步是机器人根据反馈的信息做一个标记,“你帮我续费”,“你不需要帮我续费”,“我不需要了”,出现几种不同类型的客户。如果客户答复说可以扣款,就可以直接调用银行的接口扣款。对于其他类型的的客户,再转到人工去受理这个业务。在这个过程中,我们通过智能机器人的中心不断去优化录音,优化管理和训练,去提升整个机器人的智能度。这个场景非常好,给客户带来的效果也非常好。
  下一个场景是智能通知。我们发现,在今年7月份的时候,智能通知的百度搜索量翻了2-3倍。在高度市场化的过程中,大家都积极探索人工智能能够应用在哪些方面,相比机器人,智能通知更加简洁,它只是根据一段录音,来实现跟客户意向度的沟通,或者是通知型、生产型的这种。那智能通知现在的痛点是什么呢?其实好多客户都需要文字转语音,他们面临的问题,是失真程度很大。根据我们了解来看,目前市面上所有的TTS技术都没办法做到跟人一模一样,机器的声音给用户的体验是非常不好的。我们是怎么做的呢?我们通过人工智能技术去把机械化的声音变得更加智能,更加像人说话,这样可以给客户更好的体验。应用场景像催收、快递用得比较多。
  这里我讲的是TTS的同音同色技术。市面上很多公司可能也在做,像阿里,在TTS同音同色的上面也下了很多功夫。TTS技术,所有的文字转成的语音其实都是有一个音色库,像百度地图有林志玲的声音,这些声音并不是林志玲说的,他们只是把她的声音提取参数,通过文字转语音去实现了同音同色。我们在变量和实际录音的时候,没办法通过人去录,而是将文字去转的声音和人工来录的声音结合,如“某某先生,你下个月需要还款多少钱”,中间沟通是人录音,而人名、时间、钱数,则是通过同音同色技术实现的,它可以使TTS变量听起来像人一样去沟通,这样客户体验比较好。
  现在TTS有两种方式去实现,第一种是我们讲的拼接法,第二种是参数法。参数法是我刚刚讲的林志玲给百度地图做的方式,提取林志玲的参数,它的音色是怎么样,基于电子来合成。这个是现在比较节约成本的方式,因为你只要大概知道这个音色,然后把它转化出来就好。我们现在采用的是拼接法,它有好处和坏处,它的好处是,在变量比较少的时候,可以通过拼接法来完成一个短的通知,假设这个内容非常的长,非常的复杂,拼接法在字与字的停顿中会有一些问题。但是在智能通知场景中,它通知的无非是十几二十秒的对话,我们基于这种场景包装了自己智能通知的产品,支持选择音色,有自己的录音室,有自己的音色库,去给客户做这种催收、物流、取餐语音通知等,对这个感兴趣的到时候可以找我们体验一下。
  我们在催收场景大概是这样的:1、TTS音色库录音师预先完成主要通话内容录音,把常用的录下来。大家可能不一定了解,其实所有的声音一共有1604个音调,可能有的字是相同的。2、我们把这个内容去做一个音色库,当客户提出这个需求的时候,就把他想表达的内容通过人工再去录音,再加上调用的音色库变量,实现催收欠费的通知。这样给人的感受不会像机器一样很生硬,我们现在对这一点非常关注。如果让大家感觉非常生硬,企业根本不会去尝试这个产品。客户满意度比他实现这个内容更加重要。
  下面是大家都会关注的安全。我们把咱们工信部发的要求和规范提取出来了,首要的就是严格规范业务,这个信息明确可回溯,包括呼叫规范,杜绝虚假号码,这个大家了解得比较多了。
  我们其实是把通话过程分到几类。第一个主叫是谁?这个是偏管理型的,包括主叫注册用户的认证和号码报备,或者你要求他允许你去回放他。第二是被叫,被叫涉及到数据库的能力。有些用户他可能比较喜欢投诉,比较喜欢标记,建立一个庞大的数据库,对我们的呼叫中心的业务本身帮助是很大的。云之讯现在有600万的免打扰用户,这些用户是在各种环节中,他可能表达了自己不愿意接听这个电话,或者他可能接上你的电话会标记你,这个是一个很大量的数据积累,我们做得时间比较久,在这方面积累比较多。基于此,会诞生黑名单和意向度比较高的客户白名单。第三个是通话过程。我们在做短信的安全监控的时候,其实它相对要简单一些,因为短信的传输是明文传输,在这个过程中,对于垃圾短信,我们能很快过滤它的内容。但是语音是声音,它不是文字,怎么办?我们就把它转化成文字,一个是基于录音的监听,第二个基于语音识别的技术,把通话内容实时转化成文字,及时识别它在这个过程中所表达的倾向。“请转账5000万”,这个可能是诈骗电话,可以通过与通信层的联通,呼叫控制,把这个通话挂断,保护客户的财产安全。第四个是关键指标。关键指标是有一个行为分析的,包括呼叫频次、平均通话时长,还有应答率的评估等。通过分析,我们可能发现外呼的用户并不是他们的注册用户,有可能是盲打。我们基于各种信息的监控,实现系统上的安全。
  要实现这个逻辑是我们有自己的录音平台,云之讯可以给所有客户提供录音服务。在这个过程中,我们有语音识别引擎,对录音文件进行实时的分析和检索,同时推送到我们的大数据中心,和呼叫控制中心。在大数据中心,我们看到这个结果,如果不达标就要整改。而在呼叫中心控制,我们可以及时地去避免很多不安全行为的发生。我们其实是把人工智能和通信给连接起来了,以此净化我们的环境,给我们一个绿色、健康、规范的语音通话环境。
  下面这个是我们系统的展示,我们可以根据用户的通话内容标识出通话重点,如分期、信用卡、还款等。我们在这里分类的趋势,有敏感词,有教育培训,有诈骗的敏感词,这些分析出来以后,可以分等级,一级二级三级四级,对于非常敏感的要立即处理,对于其他的则可以提示他去改进他的业务。另外我们在提供服务的时候,有些客户比如说他是做贷款业务的,可能他又跑了一个催收的业务,系统可以甄别客户使用的真实行业。假如客户报备实名制的资料跟他所使用的通话并不匹配,一个拿了房地产的资质,却做了金融的业务,系统就可以发现,马上杜绝掉。
  刚才讲的安全中心的能力,是第三个场景,第四个场景是号码状态的检测。据了解,在2018年6月份,全国放出去的号段已经有40.2万个,整个号码容量有40多亿,我们按人均一个号码可能只有12亿个在正常使用,其中有大量的无效号码。在这个过程中,我们的客户服务效率很低,因为我们发现有些客户呼叫接通率没那么高,很大的原因是有些客户已经销号了,但是他还在联系。在这个时候,我们通过人工智能的技术就可以完成一个号码状态的识别和检测。这里要讲一个技术背景,在实际情况中,运营商的反馈其实并不能标识客户到底是关停,未接通还是信号不好,它可能只会给你回一个408错误。而我们可以给客户提供一个基于号码状态识别的精准服务,我可以告诉你,你打了这些号码,他是关机或者空号或者停机,有的正在通话中你可以下次去联系他,有的客户是不是换了其他的号码,这些都是基于号码可以做的运营的事情。
  这个背后的技术并不复杂,我们基于大数据的积累,在通话的数据量基础上,分析哪些客户是通的,哪些客户反馈是不对的。这个积累,比如说发短信有回复,运营商完全是知道用户的状态是什么,我们调用了三大运营商的接口。在判断码号状态的时候运用语音识别,通话的回铃音这个数据是可以被采集到的,这个内容里面都是标准的普通话,所以它的识别率和精准率非常高,可以达到99%以上。号码现在处在什么状态,我们都可以反馈给你。
  基于此我们有哪些应用呢?第一个应用是空号检测。第二个是号码状态识别,关机,不在服务区,可以反馈。第三个是实名认证。最后一个是羊毛党的检测,根据码号行为分析,辨别出哪些是羊毛党,哪些是正常的优质的用户,帮助企业规避业务风险。
  接下来我要谈的是能力开放。其实云之讯在这么久的技术积累中,也是通过不断地探索和实践,然后有了这些技术方面的能力和基础,包括在AI,在大数据,在安全,在基本通讯能力上。我们非常愿意把这些开放给整个行业,所有的能力都提供一个开放的API接口,因为云之讯不止是软件服务的提供商,我们还希望成为一个服务能力的提供商。很多企业有自己的呼叫中心,有自己的能力,但是它又不想在通信,在人工智能上投入过多,这个时候就可以调用我们的接口。我们把接口的能力赋能给相应的合作伙伴,比如像语音识别,包括NLP、语音理解的,基于关键字的,基于神经网络的机器人学习的技术,以及话术能力,各行业的知识库,还有通信方面的,像955,代理商运营商的能力开放。我们支持所有能力向全行业开放,支持大家去调用。
  人工智能这个技术在高速地发展过程中,我们会面临各种各样的问题和困难。但是我们看到人工智能从阿尔法狗到现在的智能机器人,它是在不断提升和改变的。人工智能+通讯+数据会产生怎么样的化学反应,在呼叫中心行业里,我们可以一起去尝试,去探索。我们现在可以提供第五代的全能力的呼叫中心系统,也欢迎大家能跟我们一起来合作,一起来沟通,一起来进步。谢谢各位!以上是我的分享。
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题