首页 > 新闻 > 专家观点 >

捷通华声张连毅:HCI开启移动互联网时代新篇章

2013-12-20 16:40:52   作者:   来源:赛迪网    评论:0  点击:


  人机交互技术(HCI技术)最早可追溯到上世纪80年代,个人电脑问世后,我们最初通过键盘、鼠标与计算机进行交互。进入新世纪后,世界全面进入了互联网与移动互联网时代,手机也逐渐成为代替PC的智能终端,人机交互技术随之迅速发展到触控阶段。随着智能设备不断创新与发展,承载着云计算、移动互联网产业变革,全方位、多角度、的智能人机交互技术--HCI技术成为新时代的主旋律,掀开了移动互联网时代的新篇章。

  灵云平台 开启HCI全新体验

  2011年12月08日,首台全方位的智能人机交互(HCI)技术开放平台— 灵云(www.hcicloud.com)诞生。灵云是一种可以通过识别语音、手写(字符更好)、拍照(图像更好)、手势,及脑电波等智能手段来操作,并结合手机、计算机等数字设备的网络云服务平台。目前,灵云以“云+端”的方式,为用户提供语音合成、语音识别、手写识别、光学字符识别、自然语言理解等智能人机交互技术服务,其目标就是力求让人机交互与人与人沟通一样的简单自然。今年11月28日,灵云开放平台推出了多语种语音合成(简称TTS)技术,支持11种语言进行操作,并覆盖了全球90%以上的国家和地区。

  负责研发灵云平台的北京捷通华声语音技术有限公司董事长张连毅先生说:“灵云平台自问世以来,运营良好。这些年捷通华声的经营之道,也正如自己的母校,清华大学的校训所说---自强不惜,厚德载物。我们用在高调宣传的精力不多,而把大部分精力都用在技术研发上,只要能拿出优质的产品,就必有成绩,在语音合成的服务市场,可以说,捷通华声已占据半壁江山。”


北京捷通华声语音技术有限公司董事长张连毅

  灵云平台结合云计算技术,更高效地为用户提供便利的服务。在将来,灵云将携手海内外各个领域的用户,共同为全球用户提供服务。

  十三年服务十三亿国人

  如今,语音技术已经渗入到各行各业的人机交互应用中,捷通华声提供语音服务已有13年之久,领域涉及到铁路运输、金融、导航、互联网、手机、教育、旅游等众多行业。张连毅说,捷通华声服务13亿人民13年之久,你能想象到需要用到语音技术的地方,几乎都会用到捷通的产品。金融行业,几乎所有国内银行都在使用捷通华声语音播报功能。全国高铁沿线语音播报服务大部分也都依靠捷通的技术支持。我们的合作方式从之前单一提供技术授权转变为提供全面解决方案,并一直致力于不断研发更加全面更加智能的人机交互技术。

  语音服务最重要的是实现轻松交互,使人和机器之间达到双向交流,这种交流不仅限于语音,它的发展更趋向于全方位智能化。以车载导航为例,早期语音技术仅仅是合成技术,满足最基本的语音播报功能。后来,为了方便驾驶和安全出行,我们期望语音完全代替手指点按方式,通过纯语音交互的方式完成人在车内的各项需求,这一需求便要求人机交互的智能性大幅提高。

  HCI探索发展期 没有最好只有更好

  据中国智能语音产业联盟发布的《2013中国智能语音产业发展白皮书》称,智能语音已进入快速应用阶段。去年,中国智能语音产业规模约为8.6亿元,带动相关产业产值100亿元,预计到2017年,将带动相关产业规模增长1000亿元,占全球相关产业规模的比重将由去年的5.6%增至17.1%。在巨大的产业浪潮推动下,HCI技术又能达到怎样的水平呢?张连毅说,现在HCI技术还在探索发展期,离真正的理想状态还有很大的差距。语音识别对于噪音,口音等问题处理的还不够好,而且交互方式也比较局限,还做不到即时免唤醒的交互,技术研发正在以螺旋式进步,在HCI技术领域,我们没法说谁最好,因为技术更新很快,只有不断超越,才能实现更全面的智能交互。但是,我们相信,通过不断的技术更新,捷通将会带领用户进入全新的感知时代。

分享到: 收藏

专题