首页 > 新闻 > 专家观点 >

北京大学博士后段云峰:数据挖掘在客户中的应用

2011-04-13 00:00:00   作者:   来源:   评论:0  点击:



  2011年4月12-15日,由CTI论坛主办的“2011中国呼叫中心及企业通信”年度大会在北京国际会议中心盛大开幕并取得圆满成功。此次活动吸引了呼叫中心和企业通信行业相关各界人士的光临,共计千余人与会。会议展开了多场精彩纷呈的演讲,邀请了一批业界知名专家在会上发表演说,共同探讨未来呼叫中心和企业通信的发展方向。以下是主题演讲现场图文报道:
  本文根据大会现场笔录整理,未经与作者确认。
  段云峰:各位同仁很高兴有这个机会跟大家一起就呼叫中心方面的东西进行一些交流。在做交流之前,首先跟大家做个自我介绍,本人也是从98年开始从事呼叫中心方面工作,应该算较早从事呼叫中心博士生,当时也研究过一些软交换,也创办过《CTI世界》杂志,应该是第一届搞呼叫中心大会是99年,是我们一起搞的,现在越办越专业了,人也越来越多了,人气越来越旺,产业也做的越来越漂亮。
北京大学博士后 段云峰

  从2000年之后本人就开始转方向去做数据仓库,数据挖掘,当时包括目前都在国际上比较多,国内比较少。后面主持了国内电信运营商最大数据仓库建设,包括它的运维。所以,在这里和大家一起分享数据分析,数据仓库建设,数据挖掘方面的一些经验和一些案例。大家可以看到所有题目里头,可能我这个题目是和大家以前想象不太一样的,呼叫中心到底是什么关系?首先解释一下,呼叫中心最早做客服和客户营销,什么是客服,怎么做客户营销,用什么层面来进行提升,这也是我们的一个困惑。
  本次大致的一个内容,呼叫中心企业为什么需要数据仓库和数据挖掘,数据仓库建设实例,数据挖掘应用实例,数据仓库系统管理。用数据分析,数据挖掘方法怎么做营销,这个营销案例能够做成什么样子,跟大家一起分析我们在这方面做的一些成功经验。呼叫中心从本人接触,应该说也是10来年的时间,一个是呼叫中心从最开始通俗说法,不知道做CTi软件,中间件一直到现在产业运行,已经逐渐趋于成熟了,成熟过程中间也集聚了大家的辛勤汗水。现在也面临一些困难,现在变成一个“哑管道”这么一个缺点利润率就很低,投资的利润率就会很低这时候就面临一个问题。
  这种情况我们也会看到一个情况,我们感受到呼叫中心也面临一些产业升级,怎么去面临一些突破。这个也是我们现在,不光是呼叫中心,还有电信运营商怎么看,在电信运营商角度来看,就是渠道,承担人员外包,服务外包职能,价值不高,越来越低。大家可以看到人才流失都是相关的一些问题。
  但是另外一方面呼叫中心产业化数据,数据就是一个很重要的资产。原来在谈呼叫中心的时候强调有多少坐席,有多大的交换机,这是原来一些特点。意味着什么呢?原来我们把社会当中的资产,把设备当做我们的资产,但是在将来我们看到不远将来,我们看到实际数据才是真正资产,在坐席这方面很容易被超过,但是如果你拿到这些数据,把这些数据进行一个详细分析,这些数据才会是你真正的资产,将来使你在营销,服务,各个方面真正有价值。
  后面通过我的例子大家会对数据资产有一些更深的感受。呼叫中心大家知道最早做客服,现在承担营销责任。营销里面最大特别,很简单几句话对谁营销?营销是什么?如何营销?只要把这三句话解释清楚,那我们呼叫中心才真正能够做到位,而不是停留在简单微笑服务。呼叫中心我还很有感受,当年说法叫微笑服务。我们曾经给一个服务员发了委屈奖,最后把唾沫都吐在服务员脸上,那是在90年代末,很不容易,最后把一个委屈奖发给她。到现在只是10来年的时间,20年来的时间,你就觉得光微笑不行,现在微笑已经没有什么价值,他们需要帮助他解决真正问题。
  所以,这里面包括营销也一样,你能真正向他推销需要他的产品,这才是主要的价值。呼叫中心企业如果拿到这些数据之后,可以用数据仓库的方法,数据仓库有一定技术在里面,跟大家不在谈技术,更多谈一些理念性的东西。数据挖掘是在数据仓库基础上一个手段,以数据挖掘的方法能够实现价值。什么叫数据挖掘?数据挖掘最有名的故事就是啤酒和尿布,这是沃尔玛的故事,沃尔玛通过对他数据大量分析发现很多人在买尿布的同时也买啤酒,他后来分析为什么?买尿布都是年轻的爸爸,一般月子里头母亲都是在家照顾孩子,父亲天天往外跑,跑的过程当中给孩子买尿布的过程当中,在国外也一样,男的也顺手在买尿布的同时拎一箱啤酒拿过去了,这样他就把尿布和啤酒放的很近。
  沃尔玛当时发现放近之后,很多人由于时间来不及拿啤酒的,看到不远处是啤酒顺手就拿走了,增加了啤酒的销量。这个就是数据挖掘最经典的故事。第一这个知识人类的经验里面所不能存在的,我们过去所说专家经验,或者叫专家智能,但是靠专家头脑里有的。但是啤酒尿布是人类历史上从来没有的,所有专家也不会去支持,后来怎么形成的,是靠数据分析,这是第二方面靠数据分析,或者数据挖掘形成这样的一个知识,这是我们所谓数据挖掘一般说是很经典的故事。
  这个故事我们在国内目前情况来看有比他更精彩的案例,这个我们后头在给大家介绍。如果做到数据仓库,或者数据挖掘不一定是数据仓库,可以好好完成一个新的增长,达到一个智能型管道。电信运营商现在也在提智能型管道,他也发现干最累的活挣最少的钱。所以,这是我们看到的情况。数据仓库的概念给大家稍微带过,就是原来数据库,通俗说法就是一个仓库,因为东西多了,仓库是什么呢?大家可能有印象,就是分格,分房间,分货架,像图书馆一样这边放人文的书,这边放计算机的书,是分不同的格,我们在数据仓库里叫主题,实际上就是借助了我们传统仓库概念去做数据的积累,这样的过程通俗上讲叫数据仓库,这是一个技术概念。
  在数据仓库里面给大家说一点,数据仓库实际上没有大家想的那么难,实际上和数据库是一样,目前来讲都是这么一个架构。大家不一定搞技术,他的技术并没有那么的复杂。数据挖掘也不一定需要数据仓库,完全可以在大家现有的数据基础上做一些分析就能得出一些结论。后面我给大家介绍的例子不一定都是用数据仓库方式做的。数据仓库给大家分享一下,大概数据仓库做的一些案例。
  为什么要做数据仓库,正常的环节为什么要做数据仓库。既然数据是资产,怎么去管理资产,这么多数据,通俗说法一车东西不用放仓库,是因为有几十车的东西没地搁才需要一个仓库,才需要分门别类收起来,这就是数据仓库存在的一个必要原因,就是这个原因。所以,在这个仓库里面,现在看国内电信运营商,还有易贝大致的一些案例,实际上国内淘宝做的也不错,在数据挖掘方面也做的比较有特色,大家可以看到在买淘宝东西的时候会发现不同用户去登录的时候给你推荐的产品是不一样的,是对你客户特征进行分析的。这个技术上特征就不多说了,反正是数据仓库的一些构件进行一些集中化。
  法国电信做的移动互联网的分析,给大家稍微说一下。我们现在呼叫中心领域可能更多还是话音,从我们实践方面来看在互联网内容方面价值,通过呼叫中心这种行为数据带来的价值,内容信息更大,内容数据更大。举个例子,我们申请一个案例,是通过一个呼叫中心去卖汽车,是个比亚迪4S店,是一个省会城市比亚迪4S店。他当时通过呼叫中心去卖汽车,怎么就找到这个目标客户,他最后分析这些客户所有曾经访问过比亚迪汽车的,通过手机,或者通过别的形式访问过比亚迪相关网站和新闻的用户,对他们这些客户,当然是2万多人进行营销,他这个营销最后卖了200多台车。用他们自己的话来说,4S店一年任务就完成了,所以他就相对进行团购,做的好象很漂亮,最后呼叫中心拿了几万块收益。
  但前提需要做海量分析的时候,到底哪些用户访问过比亚迪的网站,和相关关键字的信息。还有国外数据仓库,我们在数据仓库领域,和数据挖掘领域有些方面比我们还强。我们利用这么多年时间,现在做的数据整理,包括应用的模式,应用的套路,国外始终做的比较好。易贝大家也知道现在是最大的网购,国内是淘宝,国外是易贝,易贝2千多人进行分析,每天有多少人查询。他在做这种营销,叫互联网营销也好,实际上需要大量把内容进行分析,这就需要基于内容类分析来找到真正目标客户做真正的营销,这是现在面临的一个主要课题。
  那么呼叫中心企业如何去建数据仓库,这个可能说的稍微多一点,确实IT发展分为三代。第一代数据电子化,最早出现是在上个世纪60、70年代,第二次世界大战开始结束的时候,美国人搞第一次的人口普查,实际上和我们呼叫中心也相关的。第一次人口普查是通过打电话去问,性别等等,怎么办把这个数据录到计算机里,那时候计算机还是卡片的很麻烦。那个时代就开始进行数据征集,这是第一代。第二代就是流程电子化,我们说CRM,ERP,现在都在做流程电子化,干的事实际上是提高效果。
  同时相当于跑的更快,大家知道奥运精神是令人跑的更快,但是还有一个更强,更强不是靠快能替代的。第三个就是商业智能,并不是一个学术概念,但是目前的发展,我们现在看到了这当中的应用和价值已经越来越凸显出来,后面例子可以看到。怎么进行一个基于数据分析的营销,就像我们刚才说到的营销怎么去做,不光是靠微笑,不光是靠你跟客户套词,光喝酒吃饭并不一定好使,一两个客户可以喝酒吃饭,但是到10万个客户就不可能了,这个很简单。所以,这时候我们就面临一个问题。
  所以说,以前这些营销员是靠经验,现在营销员是靠分析,甚至推销员大家看的书不少,但真正对大家有益的地方很少,但是他们的思路将来都是靠分析,而不是原来靠多好,穿的多板正,那些东西都不长久。到底这些产品推送给,后面给大家举个例子,3G业务怎么做营销。还有呼叫中心方面积累大量数据,刚才我解释的案例团购汽车,这都是真实的事。还有这些呼叫中心 企业优势执行能力很强。还有一个CRM案例反面教材,在呼叫中心建数据仓库关键点,一定要循序渐进,先见效益,技术积累十分重要,因为有了云计算可以大大降低成本。
  首先第三代智能就像一个人,一个企业和一个人是一样,任何一个企业都希望做成一个人。第一代时候希望能够成长起来,双腿直立行走。第二个阶段希望这个肌肉更加强壮,跑的比泰森还牛。人再长在粗也打不过老虎,干不过大象,但是人最后成了百兽之王靠的是大脑,你可以做智慧型管理,做一些运营监控体系管理,及时发现,就像你人大脑及时感知,胳膊不对劲了,腿有什么问题都可以及时发现。
  还有一个智慧竞争,怎么去找到相关一些客户,还有智慧营销,哪些客户是真正有价值的。在呼叫中心相关的,我们在定义上确实有这样的案例,大概一个客户一个月不超过20块钱,这都是3、5年前案例。但是他打呼叫中心当时200多次一个月,这种资源被低端客户占用,后来不得不搞服务差异化,有些低端客户巴不得你去骚扰竞争对手更好。
  这是智慧管理,就像一个沙盘。大家看到相关数据,每个地市,每个区域营业状况怎么样都可以看到。这个通俗说法像一个电子沙盘这么一个特点,这个东西也都能做到,现在都是县城的,不是故事,都是真实案例。怎么去做营销,不敢什么案例怎么找到自己客户,用什么方式,最后用什么样的营销手段去做营销。
  竞争那块也是一样,怎么去找到以往的客户。我们知道大家关心的,并不是所有客户都不让他用,而是终高端客户不让他用,这是一个地市公司的案例,折算全年大概600多万收益。还有智慧营销,还有3G业务怎么做营销,这是令运营商很头疼的事,别的行业也一样,每个行业都有这个问题,怎么做营销,不同模型,不同业务手机怎么做营销,还有移动固化,TD怎么做营销。
  我小结一下,呼叫中心在数据仓库方面是大有可为的。实际上刚才很多数据,这些东西呼叫中心都可以做。数据仓库建设就不跟大家象祥述了,这是一个电信运营商建立的案例,目前是世界最大的,8千多个TB数据量,这个量规模很大。而且国际上现在看没有电信运营商那么大,像刚才所说易贝很多数据放在云存储上,但是他做的分析复杂度不如像数据仓库那么复杂。包括操作用户数,看到上行55,从74%能够增长到97%,这些都是一些省公司的案例,所以相对来说比较大。
  然后你能看到它的价值提升,营销提升两倍,还能做一些收入风险监控,这是一些具体案例,这不是故事都是真实案例。这些案例我后来给大家看到都是地市公司更小,不是那么大。重点我们想说的有三个数字挖掘案例,三个数据挖掘的算法,后面都可以去学去做研究。这三个地市做了不同算法,大家可以看到我们所谓智慧营销,或者智慧客户服务是怎么样利用数据分析,数据挖掘方式,通俗来讲像美国人打伊拉克一样点对点打信息战,而不是原来完全靠摆台,不是靠这种人扑,相对而言体验是智能型的东西。
  第一个案例是中高端用户保有,很多包括高端客户剖去对营销成本实际上是负的,越分析越有意思。人类一思考上帝就疯狂,只要一做数据分析,这个案例就成果很显著。这个中高端保有一样,最后这个价值准确率是70%,覆盖率是80%,准确70%是对的,覆盖率总共有100个预测80,这些都不说了。这些是一些保有,前面要做流失预警,还有客户细分这些数据挖掘的方法,还有客户营销策略。
  怎么去做这个预警,包括预警方法构建,有日监控和月流失,用日监控怎么做,用一些算法分位数法进行计算。后来发现确实通话间隔流失率是紧密相关的,这些东西都是数据,不是说大家的感觉,啤酒尿布一样没有经验都是靠数据得出来。不是说某个专家我有这样的知识,经验,不是的,是靠实际的数据分析得出来的。
  根据这个分析,很多人以往一个征兆不打电话或者打电话的多少决策,这有一个量,这是一个大概覆盖情况。刚才上面是一个以往预测,还有一个细分。中高端客户去进行细分,上面有一个数据,ARUP,按照相关属性,这些计算属性就是我们去做数据挖掘相关的象,最后分成各个细分的群,比如我要话音分成这么七个群,每个群有什么特征,本地通话没有长途占比多少,还有以本地与长途为主。这些东西可以看出来就是我们所说的客户群,中国人讲物以类聚,人以群分,国外也是,中国人的圈子大一点,国外圈子稍微小一点。
  这些算法不跟大家解释了,这个我们可以看到在这个群里面我们找到几个关键群体,大家可以看到我们精确服务,不再是我们原来满天撒胡椒面,我可以把我有限的营销成本放在刀刃上,这是一个细分群的结果。至于每个群有什么特征,每个群还要建立保守策略,营销策略,这是一个具体做法,这个做法可以看到,不管每一个相关的子群,找出这个群来。第二制定相关保有方案,怎么做营销。
  大家看到每一个群都有一个营销策略,可以看到我们所说的信息战是一样。应该说对整个中国人的刺激很多,包括军方,第一次海湾战争打了之后,第二次打了中国人觉得伊拉克又打游击战,最后发现什么都没有全垮了。我的导师曾经去过伊拉克,咱们呼叫中心机房可以做到什么,从窗口炸老交换机,可以想到精确到什么程度,就是为了炸你交换机,当时看完之后,是中国人看完都很震撼。当时伊拉克我们要是按照老毛的传统战争肯定不行,最后打完仗之后美军死亡还不到100,好多还是开车自己撞死的。
  所以,这个战争是在历史上没有出现的。一样大家还可以看到,我们营销也可以做到精确性打击和精确性营销。最后总结一下,本次红带来额外新增用户数为6万多用户,这是一个比较穷的,不算发达。带来一些中高端的保有情况,最后一张效益,也要投入一些成本,营销活动投入成本是600多万,这个成本增长了7%,技术增长12%,这个技术是1.69亿,所以这块能看出来它的收益极其庞大,整个项目投资大概不到100万,可想而知只要我们去思考,我们利用数据分析方法真的上帝就会发怒。
  第二个案例怎么去做营销,3G业务怎么去做营销。刚才说了整个例子,三个业务做营销,一个是手机,还有芯机,还有视频手机做营销。通过电话,还是互联网渠道,电话只是一个渠道等等还是什么模式,所有营销换或者不换有人类开始营销就干这四件事。我们只是不同时期加入不同技术手段做的更好而已,怎么去做,找谁去做营销,这里面也一样。这里面我没有把算法,像刚才一样有详细复杂的算法都是有的,这里面用到相关的一些模型,还有一些决策速度,最后得出相关模型,每一个算法都需要有模型,对谁去做TD视频营销,手机营销都要形成。
  这样的一个情况可以看到完成结果,消费不错,拉动了一些具体数据,大家可以看到TD变化。这些大家看到的是增长,站在运营商角度这个增长就是钱。它对业务拉动的情况可以看到,和竞争对手比较,竞争对手越来越少,实际上我现在客户到底有多少好的竞争对手可以看一下是呈下降趋势。刚才这个案例我没有给大家展开,实际上做数据挖掘模型数据分析,和我第一个给大家看到的案例是一模一样的。实际上大家可以看到这就是我们所说的数据分析谈到,不在像原来那样都是微笑服务,包括对客户体验差异,这个差异是分出来,不是凭你的感觉,凭米的经验,这是最大的特点。
  综合监控,大家刚才看到相当于具体演练,我们这样的人跟泰山打架肯定找死,我用什么方法,刚才看到是扬沙子的战术,我怎么能够把各种各样战术整合起来像人一个大脑一样检测整个企业实时运转情况,身体是不是异常了,是不是感冒发烧。我们不同地区,每个地区各个业务经营情况具体进行分析,这些都靠数据,而不是靠过去拍脑袋凭感觉。
  销售的监控,还有对渠道监控,这也很头疼,渠道这方面实际上有很多欺诈行为,对运营商而言带来很大收益。所以,这是一些内容,哪些渠道真正有帮助,这种做出来很有意思,我们发现很多有意思的现象。原来你靠人工根本识别不了,通过数据分析之后,这个人是不是正常。这些监管每一次都可以看到具体执行情况,有什么问题及时派相关人员看到,这就是一些图表,给大家看到相关一线怎么做支撑,这也是一个价值的运营提升。
  这是一些案例,我们有了一个数据分析之后,怎么结合我市场生产变成一个有价值的收益,这也是一个大致描述。还有新增市场的异动也很关键,作为任何一个企业需要对他自己的产品十分清楚才行,比如大家做呼叫中心一样,每一个产品都需要很清楚,做多少次,用户满意度与否都需要知道,哪些客户是盈利或者不盈利的,这个比例能够看出来,这个盈利与否都靠真正数据,不是花一千块钱或者多少钱,我营销可能要花1500因为我是负价值,这样的内容案例是很多的。
  这一章小结数据挖掘是无处不在的,这些小应用没有大家想的那么复杂费劲,真的可以看到四两拨千斤的效果,做好这些数据,数据挖掘的应用我们确实能够见到大的收益。这一点也是我前面跟大家所说的呼叫中心怎么做产业升级,如果我们把现有硬件用好,再用上相关分析,把数据当成资产来处理,那我们真正能够挖掘出我们自己的宝藏。如何避免骚扰,当时315暴光很多业务不能随便客户打电话,不能给客户随便发骚扰短信?
  二者之间区别是否找到客户真实需求,你发现我经常给宝马4S店打电话,或者给奔驰打电话你就可以分析出来我可能要买车。比如营销房子为例,对我们而言就是骚扰,因为我不需要房子,我现在想买的是车不是房子这就是骚扰。我想买宝马或者奔驰车,你最后跟奔驰的4S店联系,自己大4S店,现在不流行团购,自己到4S店能拿一个95折就好了,你一出面9折,对我而言这就不叫骚扰而是服务。
  所以,这个恰恰体现了我们数据分析重要性。我们是不是找到一个用户真实需求,就能够为用户服务过程当中带来更多价值,更多的利润。如果没有详细分析,我们不断的骚扰客户就会被客户投诉,被市场所抛弃,这是我们现在面的一个困境,也是这样一个不得不去做的问题。所以,现在在运营商也是在控制这一数量,不能对客户进行骚扰过度,他有详细分析,你想对用户进行外控必须拿出我刚才看到的,详细分析之后才能进行相关操作。
  数据仓库一些管理内容就不跟大家详细介绍了,还有几个关键问题最后跟大家分享。一个是呼叫中心如何获得这些数据,大家也知道原来资产是我们所谓说的做交换机多少人,但是现在来看将来真正有价值不再是这些硬件,这些软件,这些数据,美国人说起来他用的飞机,大炮实际上和伊拉克某种意义上讲差别不大,这就是差距。所以我们强调所有呼叫中心将来看到差距不再是你有多少个坐席,不再是利用多少客户站点,而是你能不能够获得足够多的信息获得更大的利益,更大价值。
  还有怎么去做这些数据仓库,在呼叫中心里大家可以先做一些集合。还有怎么去做数据挖掘的应用,数据挖掘还刚刚起步,没有大家想那么难,很多是一通百通的问题。包括不同产业里面,不同行业里面不同应用,如果管理数据挖掘可以外包,可以连锁经营方式都可以。但是大家手里是有一堆宝藏,有一堆有价值的东西能给大家带来钱还有操作你当年对呼叫中心投资成本,这是希望给大家介绍的。
  整个一个发展标题里面也说了,希望呼叫中心产业数据挖掘能够更上一层楼,看见价值,充分体现我们智能营销,而不是靠我们拍脑袋,是靠数据来说的。这是第一点需要数据挖掘真实服务,而不是骚扰。如果找到用户真实需求而不是骚扰。为什么要建数据仓库,人类在进化,企业也要进化一个道理,人类之所以成为百兽之王就是因为大脑,而不是靠胳膊腿,这是最大优势。企业也一样,企业或许今天没有跟上时代的步伐。
  大家也能理解我为什么去做这个领域,国外管理一个最核心理念通过数据来得知结论分析来做营销,这个实际上是整个,或者叫营销的一个本质所在。在技术方面,国内大家也看到,我刚才给大家讲都是一个真实案例,数据都是真实的,大家可以看到没有大家想的那么难。大家能够看到他的价值,确实能体现出来一个情况。这之情况就是这些,这些内容和大家原来接触的不是特别多,下面有我邮箱,大家如果需要后续沟通的话可以跟我发邮件,谢谢大家。

CTI论坛编辑

相关阅读:

分享到: 收藏

专题