您当前的位置是:  首页 > 新闻 > 专家观点 >
 首页 > 新闻 > 专家观点 >

AI界的甲骨文:捷通华声耕耘十六载 势为产业中坚

2017-02-08 09:36:45   作者:极客王子   来源:亿欧   评论:0  点击:


\
  1989年结束了清华大学环境工程学业后,张连毅就投身OCR(光学字符识别)行业,从打工、到创业、出国深造、回国重新创业。斗转星移,在朋友的帮助下,1998年创建了捷通软件,一开始做回“老本行”--汉字处理和录入。推出了“录易汉语智能输入输出系统”,成为国内第一家将语音合成、语音识别、手写识别技术成功集成在OA办公软件系统的公司。
  捷通华声经历三次转型,因时势去,因时势来
  第一次转型是在2000年底,基于硬件销售风险很大,利润越做越薄,而捷通一直缺乏核心技术,因此决定转型,联合中文语音专家吕士楠教授,一起成立北京捷通华声语音技术有限公司,要做语音合成。
  第二次转型是在2002年,捷通华声既没借助资本、也没拥抱政府高校,光靠语音合成,企业生存维艰,于是在兼顾语音合成、语音识别、OCR、手写识别的同时,做起了SP(服务提供商,功能手机上面的游戏),一做就是9年。
  第三次转型是在2011年,张连毅意识到语音技术的机会要来了,于是再一次决定转型,砍掉游戏业务,全力进军人工智能。
  捷通或许能成长更快,假若早年借助资本
  在人工智能领域,张连毅算是老兵,另一家比捷通华声早一年成立的是科大讯飞,人都有对比心态,张连毅也不例外。他认为在捷通华声被科大讯飞拉开的差距很大程度上是创业早期没有重视到资本推动性作用,当捷通华声在2011年10月首次引入华软创业投资时,科大讯飞在2008年在深交所已经实现上市。
  这种教训是非常深刻的,在现在股权投资越趋完善的背景下,张连毅加快引进资本。在2013年5月,捷通华声引进百度网讯作为新股东、在2014年3月引入北京水木启程创业投资(清华大学产业基金)作为新股东、张连毅告诉亿欧记者,在2017年捷通华声计划再做一轮融资。
  捷通华声在早年并没有借助资本,也没有拥抱政府高校,而是选择一步一脚印,将优质产品输出,获利后再投入生产的运作模式,鉴于近年来股权投资发展越趋成熟,人工智能风口一时,捷通华声在这个节点融资再发展,登上新台阶未尝不是更稳健的发展路径。
  在人工智能圈子,在年龄上,相比起俞凯、刘庆峰、梁家恩而言,张连毅算是老大哥,在做事上,少了几分冲动与激情,多了几分稳重。在营收上,有稳定增速的营收额和利润,在人才培育上,张连毅善于搭建班子。区别于赌性较强的创业公司,捷通华声是做生意/事业的公司,借助资本只是为了跑得更快。
\
  背靠清华大学,打通产学研,捷通华声技术创新底蕴深厚
  不难发现,人工智能作为技术驱动型企业,资本特征是前期投入研发经费大、人才特征是是高学历、跨学科、需积淀。国内大部分高校并没有设立人工智能相关学科教育,在人才招聘上,必须与高校捆绑,在校期间完成入门知识培训,进入企业即可上手工作。
  在产品驱动创新上,需要基础学术的不断投入研发,而基础学术独立于高校,自行研究,在成本效益上并不是明智的选择,人工智能必须将产学研三者紧密连接。因此,我们看到,凡是深入到产品基础技术研究层面的公司,几乎都与高校建立人工智能实验室。
  科大讯飞背靠中科大(中国科学技术大学),思必驰与上海交大共同设立思必驰上海交大实验室,而捷通华声跟清华大学的关系更为紧密,在2013年,清华大学产业基金入资捷通华声,成为第二股东;2014年,清华工业研究院与捷通华声共同创建灵云人工智能研究中心;2015年清华校友总会邀请捷通华声共同成立“清华校友总会人工智能联盟”,同年,清华海峡研究院与捷通华声在福建厦门创建人工智能研究中心。
  以上都可见捷通华声的学术根基之绵长稳固,一旦形成产学研的纽带,只要能耐得住研发的煎熬,也就能收割技术进阶带来的红利。捷通华声对于清华人工智能研究来说,是市场之眼、资本之门。
\
  人工智能四大派系
  在人工智能创业潮可以基本分为四大派别,以张连毅、芮勇、俞凯为代表的清华系、以刘庆峰、山世光、梁家恩为代表的中科院系、以朱珑、柴金祥、吴甘沙、周曦为代表的海外派,以BAT为代表的企业派。
  四种势力瓜分着人工智能主要市场,其他入局者由于缺乏先天资源,往往在人才体系或者资源供给上显得薄弱而处于弱势地位。
  65后捉方向、75后挑大梁、85后新兴力量
  捷通华声规模近200人,其中研发人员占比65%,在人才方针上,张连毅秉持65后捉方向、75后挑大梁、85后新兴力量的人才阶梯战略。在2017年,张连毅的管理思考是三个方面提升:①强化售后服务;②提高产品稳定性;③提高个人产能。顺应趋势,在2016年股改并引入合伙人制度,激发公司人才全链条的积极性。
\
  捷通华声主推的产品是“灵云全智能能力平台”,几个特点:
  ①全智能,区别于单一人工智能产品公司,张连毅认为在人工智能初期,单一产品营收企业举步维艰;而人工智能爆发期,企业需要多维度的人工智能产品,单一产品公司“满足不了需求”而被淘汰出局。
  “灵云全智能能力平台”涵括语音识别(ASR)、语音合成(TTS)、自然语言处理(NLU)、声纹识别(VPR)、光学字符识别(OCR)、手写识别(HWR)、人脸识别(AFR)、指纹识别(FPR),因此称为“全智能”。
  ②多场景、倡导合作共赢。人工智能目前所能影响的领域和行业,捷通华声都有触及,区别于直接提供TOC和TOB产品的公司,捷通华声不直接对接需求端,成为各行业系统集成商、解决方案提供商、行业软件开发商背后的服务支撑,提供人工智能能力支持,协助其更好地输出产品。
  在2016年,捷通华声也在尝试将多项人工智能能力结合成行业方案输出,形成了集“技术研究—产品开发—服务销售”一体化的运营模式,独立构建起由灵云公有云服务、灵云全智能能力平台、灵云智能解决方案组成的立体生态型灵云产品体系。
  ③基于平台特性,“灵云全智能能力平台”同时具备标准接口、易集成(兼容性)、松耦合、易拓展(灵活性)、高可靠、稳定高效(稳定性)。
  张连毅从业经历总结,在2016年6月之前的5年是人工智能启蒙阶段,而随着百度、腾讯、阿里、搜狗、华为等“航母”开进来,人工智能的战役才刚打响,而这场战役来临之前,已经储备好学术人才资源、公司人才组织架构优化、资本引进,在2017年,张连毅决定打一场漂亮的进击战。

专题