首页 > 新闻 > 专家观点 >

捷通华声董事长张连毅:牢固根基方能茁壮成长

2012-11-21 11:20:13   作者:   来源:C114中国通信网   评论:0  点击:


  本月28日,由北京捷通华声语音技术有限公司(以下简称“捷通华声”)打造的国内首款智能人机交互(简称“HCI”)感知云平台——“灵云”将正式对外发布。这样一款汇集融合了语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、人工智能(AI)等多种HCI技术的全方位平台,在国内属首创,目前还没有企业有能力跟进。

  在捷通华声“灵云2012发布会”前夕,C114前往捷通总部对该公司董事长张连毅进行了独家专访,请他对灵云平台核心技术及市场拓展情况进行了详细解读。

  一周年的能量蓄积

  如果说Siri引爆了人们对智能语音对话的关注,那么灵云则开启了一个智能人机交互的新时代,这是信息社会自键盘时代、鼠标时代及触摸时代后的又一浪潮。灵云以其丰富的识别手段,以及全面智能的感知为用户提供了一个人机交互应用的良好环境。

  这是一种可以用语音、手写、拍照、手势识别,将来甚至可使用脑波识别等智能手段来操作,从而感知手机、计算机等数字设备的网络云服务。通过灵云能让人机交互像人与人沟通一样简单自然,并可实现任何人通过任何设备在任何时间地点轻松享受到智能人机交互的便利。

  早在去年12月初,“灵云”就已推出,但为了能将更成熟的技术推向市场,捷通华声在灵云推出之后陆续展开了各方面的应用探索,直到一周年后的今天,灵云有了全新的2.0版本,并已在各行各业取得了良好的应用成果,捷通华声才决定正式将灵云面世。

   目前灵云主要有语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、人工智能(AI)这五项核心技术。语音合成即文语转换,主要利用计算机将文字转换为声音,语音识别则是将声音转换为文字,而手写识别主要将手写设备上书写时的有序轨迹信息转化为汉字。另外,光学字符识别是对各种表格票据证件进行扫描后,获取文字及整个版面信息。智能客服机器人则是以语音拟人化的方式与人进行互动。

  一周年中,捷通华声不仅对灵云平台稳定性及抗压性等各项性能指标进行了提升,还对灵云的产品性能、合作模式及各项HCI技术应用进行了探索与扩展。张连毅说,“在此期间,灵云各大核心HCI技术上都有显著进步,特别是‘自由说’技术已进入商用化阶段。”

   张连毅表示,目前灵云的主要目标是提升平台能力及自身核心技术,不断将成熟的HCI技术通过灵云提供给大众,而下一步就是促成更多的合作。

   不断拓宽的纵深合作

  随着HCI技术在各行各业的大量需求,灵云的应用范围也将无处不在。目前国内数以亿计的用户都在直接或间接地使用捷通华声的HCI技术,但很多用户并不能明显感觉到。“捷通华声成立十几年来,更多的是作为幕后支持者,通过与各大系统集成商、手机制造商、导航产品厂商等合作来服务大众。”

   据张连毅介绍,目前,捷通华声已与数千家企业合作,将HCI技术应用到各行各业中,不仅有政府、教育、金融、电信、能源、交通、医疗等传统行业领域的客户,更有智能家电、智能家居、互联网及移动互联网、智慧城市等新兴领域的用户,大到服务成千上万用户的平台,小到个人开发者,捷通华声的HCI技术在中国已经无处不在,默默服务数以亿计的大众。

   谈及与中国电信的合作,张连毅表示,早在2008年捷通华声就开始与电信进行增值服务方面的合作。至今捷通华声在电信的增值业务中仍居首位。目前捷通华声已将灵云与中国电信正在开发的EMP平台实现无缝衔接,成为其开放平台的重要组成部分,而捷通华声则负责提供其中的人机交互技术支持。
 
   张连毅强调:“捷通华声高度重视与中国电信的合作,灵云与中国电信EMP平台的无缝衔接,标志着捷通华声与中国电信的合作已迈入新阶段。之后捷通华声将与中国电信拓宽合作面,包括在音乐基地、游戏基地、阅读基地等方面,捷通华声将发挥灵云优势,为中国电信提供更多的HCI技术支持。”

  当问及中国移动与科大讯飞在语音云方面的合作是否会影响捷通华声灵云与中国移动的合作时,张连毅说,“灵云与语音云有很大的不同,区别在于灵云不仅提供语音云服务,同时也提供手写识别、OCR等更多项HCI技术云服务,因此捷通仍然会与中国移动保持合作,当然我们现在的重点是中国电信,也有中国联通,我们也一直和中国联通保持着在增值服务领域的合作,希望日后也能在HCI技术上有相关合作。”

  此外,捷通华声的HCI技术不仅吸引了大批合作伙伴和个人开发商,许多各大投资商也极为关注。C114前去采访的当天,就见到了专程从南方远道来访捷通华声洽谈的投资商。

  当然,除了与各大企业合作,捷通华声也希望能与从事各种人机交互技术研究或开发的企业合作,从而将灵云平台作为其展现、推荐及提供自身技术服务的平台。灵云作为一个开放性平台,定制化的目标更加明确,将让更多HCI研发人员在此平台实现创业梦想,这也是此次捷通华声2012灵云发布会的亮点之一。目前,灵云未来的版本已经开始与国内从事HCI技术的企业与研究机构进行多项合作,力求将多样化的HCI技术加载到灵云平台上,服务更多企业,服务广大众用户。

   牢固根基下的枝繁叶茂

  按照去年的统计数据来看,捷通华声已在国内语音市场占有50%的份额,而其手写识别技术已达到35%的份额。“一周年来,这两项份额稳中有增,虽然竞争对手强劲,但捷通在更加宽广的HCI领域得到增长。”张连毅透露,目前捷通华声的HCI技术产品已经展现出强劲发展势头,已全面深入渗透到各行各业。

   2010年世博会广播系统的语音技术,80%是由捷通华声提供支持。全国的高铁所有站台的信息播报系统,都是采用灵云的语音合成技术。目前国有五大银行中的四家都使用着捷通华声的HCI技术。而最近其也刚刚与百度达成合作,将灵云的手写识别技术引入百度输入法。

  张连毅坦言,在公司初创时,并没有料到HCI技术会在今天有如此广泛的应用,如今各行各业都需要这种智能的人机互动技术。而随着未来人机交互技术的发展,灵云也将紧跟人类的步伐,让机器与人的互动更接近人与人的交流。比如未来的语音合成技术应该能有音色、感情色彩等特色功能的选项,而语音识别也能对国内各个地方的方言有清晰的辨识。智能人机交互技术将是推动未来信息产业发展最强劲的发动机。

  而在未来的发展中,捷通华声最需要的就是各种优秀人才,以满足灵云与HCI应用到各个行业所产生的大量需求。张连毅表示,捷通华声非常乐于为各方面的优秀人才创造发展的舞台。

  “捷通华声未来的发展就像一根树干成长到枝繁叶茂的过程。捷通华声拥有的核心技术就是大树的根,灵云平台是大树的主干,而灵云在各行各业的应用是大树的枝杈。”张连毅表示,“包括由捷通华声提供技术支持的智能手机助手小唐龙,一款可为用户提供地图导航、天气查询、音乐搜索、新闻播报等特色功能的手机应用程序。如果说这是捷通华声在手机App方面的探索产品,未来将有更多类似小唐龙的创新产品出现。”

   以牢固的根基养育大树的枝繁叶茂,这就是捷通华声所坚持的发展理念。而在这发展过程中,无论过去还是未来发展,捷通华声不会吃独食或分抢别家利润。独木不成林,只有无数棵茁壮成长的大树才能造就繁茂的森林。捷通华声将与各界合作伙伴精诚合作,共同创造智能人机交互领域的繁荣景象。

  注:捷通华声“2012灵云发布会”将在中关村软件园召开,欢迎各界人士到灵云网站(www.hcicloud.com)报名参加)
 

分享到: 收藏

专题