您当前的位置是:  首页 > 新闻 > 专家观点 >
 首页 > 新闻 > 专家观点 >

普强信息何国涛专访:一个低调的语音数据分析公司

2017-01-03 09:23:10   作者:   来源:亿欧网   评论:0  点击:


  做大数据挖掘和大数据应用的公司很多,但是做语音数据分析、挖掘的公司并不多,国内不超过5家,普强信息是玩家之一。语音大数据挖掘分析服务,是一个技术导向型的服务,语音数据挖掘的流程是:先将语音转换成文字,然后对文字进行算法模型分析,以达到精准营销、质检等目的,所以语音大数据分析公司必须具备两个技能,第一,需要在特定场景下语音转换成文字在速和识别率上处于行业领先地位,第二,需要对客户需求有深入了解,设计合理的模型,两者缺一不可。
\
  企业介绍
  普强信息成立于2009年,是一家以北京为总部、硅谷设研究院的语音数据分析公司,在产品方面,2010年推出面向呼叫中心推出的“千语千寻-语音识别引擎系统“和“千语千寻-360度语音分析系统“,意在“电话销售“过程中,提升名单转化率、挖掘潜在需求、降低客户流失率。在2015年,普强信息发力车载“新场景“,联手四维图新和腾讯共同开发智能车联网大数据系统,通过大数据挖掘,目标是做成个性化的车载金融服务产品。
  普强信息创始人兼CEO何国涛是澳门人,在北京大学和美国费城大学分别获得计算机系硕士学位,在硅谷语音及通信产品领域拥有20年的研究、开发和管理经验,公司规模100多人。
  回顾普强信息的所有融资情况,在2009年获得黄炎松个人100万美元A轮投资、在2013年获得戈壁创投500万美元B轮投资、在2016年9月获得戈壁创投、四维图新1000万美元C轮融资。
  为什么要做语音数据分析业务?
  普强信息算是语音呼叫中心从业者熟悉的明星公司,需要呼叫中心的通常是金融、保险、电商、电信行业,这些行业需要通过语音对话的方式获取客群、了解客群、服务客群,这些企业体量都不小,数据分析服务会以招投标的形式对外发布。
  普强信息市场负责人谢少娜透露,在过去的2016年,在公开投标市场中,普强信息尽管遇到中科信利、捷通华声、科大讯飞、VERINT、Nuance等竞争对手,仍然能够取得70%以上的中标率。
  何国涛是一个对数据敏感的理工男,他每年会花几天的时间去研究科大讯飞、Nuance两个语音巨头的财报,在里面发现机会点,制定下一年的规划,并且ALLIN投入,他分析:之前决定做语音大数据分析就是基于两个观察要点:科大讯飞语音分析收入占比很少(刚起步)、营收同比增速翻倍(发展空间巨大、市场爆发),基于这两个观察,他觉得让团队ALLIN到这个领域,用了3年的时间就把这个市场做到占有率第一。
  另一个发现是车载场景下的数据挖掘,随着车厂对车载环境下的语音模块的认可、新车搭载语音模块成为标配,但是基于车载环境下的数据挖掘有800亿的市场,因此何国涛在2015年开始了面向车载的数据挖掘业务。
  普强的业务尝试
  在PC互联网时代,大家的搜索方式是浏览器,所以百度成为了一个巨头,在移动互联网时代,搜索方式发生了变化,主流是文字搜索和语音搜索,百度要捉住移动搜索的红利,所以不断的推动语音搜索的进步,可以看到移动端百度搜索已经将语音搜索列到很重要的位置。
  在手机的常用APP中,腾讯阿里百度占比90%,所以它们有移动互联网搜索的绝对性优势,他们有数据的获取优势,对于初创公司做语音搜索是一件不靠谱的事情。何国涛也曾经做过移动互联网的语音搜索入口,但是发现两个问题:①不是刚需、②无法商业化。为此他不得不寻找新的语音切入点,他分析什么是刚需,最后发现基于语音的分析是一种刚需。
  何国涛举例,平安保险有2万人每天进行电话营销和服务跟踪维护,如何保证业务员在操作过程中没有违规,服务良好?这就需要一个质检员的角色,以往的方式是一个质检员盯10个一线业务员,普强信息就是在人员和效率做优化,将一线业务员的对话录音转换成文字,然后通过敏感词搜索的方式建立模型,进行监督,达到100%质检效果。
\
  另一作用是精准营销,在电话销售行业,20%的人做到了80%的业绩,10%的人入错行,可以劝退,剩下的70%还是想把事情做好,但是缺乏一些技巧。普强信息能够用语音大数据分析到【业务员说了哪些话,客户就会把电话挂掉】,将这个信息告知业务员,从而提高业务的转化率,中国整个保险市场有3万亿,能够提高0.1%成功率,就是新增30亿的营收,这是很大的一块市场,同时也是相当稳定的一块业务。
  这块业务比拼的要点有三个:①识别和分析的速度,普强的产品能够让分析操作在15秒以内,实施周期短;②识别率,普强的电话全文识别可达到85%以上;关键词识别率达90%以上;③数据的处理量,普强通过亿万条信息的压力测试。
  普强信息的何国涛透露,全文识别达到85%是写进合同里面的,并不是吹嘘的,而在技术提升上,如果数据库足够大,还可以提高到90%的识别率。
  这种语音的大数据分析系统,能够让客户流失率降低5%、转人工来电量降低3%、平均通话时长降低10s、数据利用率达到100%、工作效率提升16倍、成单转化率提升10%。
  普强信息的壁垒和门槛
  何国涛认为自己的两款产品是有时间门槛,首先你需要花2-3年把产品做好,然后在市面上找一个标杆客户,磨合产品,切实为标杆客户提高企业效率,这又花了1年时间,而且面向金融和保险行业的电话销售产品对企业信誉要求比较高,真的快不了,要业务大量爆发已经是5年后事情了,很多人耐不下心去做产品,这就是普强的壁垒。
  数据分析系统做了5-6年日渐成熟,何国涛希望将盘子继续做大,进军车载+数据挖掘市场。他做了这样一个规划,在2015年,普强加大对车载人机交互的产品研发,2016年,接受四维图新入股,迅速渗透车厂和车机系统集成商(博世等),2018年,挖掘车载大数据,首先应用于车险领域。
  与腾讯、四维图新合作的车联网生态建设中,合作模式是四维图新提供硬件、车机系统、地图,腾讯提供车机应用,普强信息提供人机交互技术。车载大数据可见的应用是UBI模式车险,这需要集合车厂、车机、金融保险公司、语音及数据分析公司多者配合,何国涛认为普强信息与四维图新的联合,加进其他玩家,这个目标是有可能实现的。
\
  何国涛认为,尽管目前车载的语音在识别方面成熟度挺高的,但是仍然有很多软硬件、实际场景下的问题,例如:车有一个通用的芯片,要做到人机交互本地化,需要另外添置一个DSP的高性能芯片;在前装市场,对语音模块的本地化要求比较高,但是本地化的内存和数据有限,如何既能够满足极端情况需求,也满足高辨识,这就需要云端识别和离线识别,而车载环境下有噪音,需要阵列麦克风进行降噪,这些难点都需要一一攻克。
  何国涛认为,语音技术的门槛不是最重要的,技术人才可以通过资本的形式拉拢过来,但是合法如何获取高质量的数据是非常困难的,因此获取数据是实现数据分析的第一步,数据分析要服务执行,执行产生效率,一共四步才形成了语音数据变现的闭环

专题