首页 > 新闻 > 专家观点 >

灵云语音服务2亿大众,捷通华声推动HCI产业发展

--专访捷通华声董事长张连毅

2013-11-07 14:15:17   作者:王丽娜   来源:CTI论坛   评论:0  点击:



  灵云开放平台凭借捷通华声十几年的功底,语音合成、语音识别技术无论在“云”还是“端”,用户均可以轻松调用。灵云语音合成播放轻松自然,尤其值得指出的是,灵云可让合作伙伴选择适合于自身应用的多种声音,并提供中文普通话、粤语(广东话)、维吾尔语、英语、德语、法语、俄罗斯、西班牙、日语、韩语等在内十几种语言的语音合成能力;而语音识别因其对硬件资源的特殊要求,实现“端”识别对技术提出更高的要求,灵云离线式语音“端”识别以识别率高、定制简单等特点,与灵云语音合成一起为用户提供几乎完美的智能语音“云+端”服务。

  张连毅讲到:“灵云率先推出‘云 + 端’服务模式,是捷通华声的一种理念,一切为用户着想,即‘舍弃’云端服务可以获取所谓宝贵数据资源与用户资源等利益,满足用户甚至在没有网络的环境下,仍然能够方便使用智能语音技术能力,也让数以亿计的大众不必为‘高昂’的流量费买单,轻松享受智能语音等HCI技术能力的服务。”

  一项好的智能人机交互技术简单来说,就是让机器更好地“读懂”用户的意图。随着语音识别率地提升,在确保识别率的前提下,对于噪音的处理就显得尤为重要。在噪音环境中,有一项技术不可或缺,它就是语义理解。张连毅称:“灵云语义理解可对输入语音的语义进行分析,保证识别率的同时,也确保语音合成播报使用者需要获得的准确信息。”

  据了解,灵云“云 + 端”自推出以来,迅速为产业所接纳,不仅提供智能语音技术于导航领域,百度语音助手、搜狗语音助手、聚熵360、南京米果、虫洞语音助手等系列语音助手软件;天行输入法、百度输入法、触宝输入法,也包括“汉字英雄”、汉字书写大赛更是将智能语音、智能图像“云 + 端”及其合作模式,超乎想象地完美应用。

  随着智能语音技术引发关注,智能语音“互联网入口说、关卡壁垒说、大数据说、资本说”等各种说法风靡IT产业,甚至最近又出现了“血统说、家族说”。面对众多学说,张连毅则一笑了之,只淡然说了一句:“说一千,道一万,语音识别、语音合成其实就是‘工具’,一个人与机器交流的工具。”即无论什么时候,智能语音交互最主要的核心功能还是一个声音录入与输出的工具。张连毅介绍说,智能语音技术差不多每十年就“热闹”一场,他相信:当智能语音更加实用,也充分满足了大众的好奇之后,很快会象过去一样回归到自然与纯朴——在这个领域中,有心的,会安心提高语音识别准确率、语音合成自然度,关注用户使用与体验;炒作的,一定耐不住这种技术螺旋式进步的“寂寞”,受不了“只有更好、没有最好”的刺激,也会悄然退场。

  合作共赢,促进中国语音产业发展
 
  谈到将要举办的“2013中国语音产业年会”,张连毅并不隐瞒对语音产业联盟过去的失望,及对未来已拥有的很高期望。去年,在工信部支持下成立的中国语音产业联盟,却只有一家专业语音企业,包括捷通华声、中科信利、得意音通等专业语音公司,及百度、腾讯等从事语音技术应用的大型互联网公司,甚至清华大学实力强悍的语音研究机构均被“莫名其妙的挡在外面”。张连毅说,这次年会,很高兴看到工信部相关领导与相关部门的高度重视,并深入到国内所有语音企业、研究机构中调研,充分听取各方意见,促成了一个真正集“产、学、研”一体化,几乎容纳所有语音技术领域相关企业与研究单位参加的语音产业联盟的诞生。

  张连毅认为,语音等HCI技术产业拥有巨大的发展空间,要跳出“狭小”的空间,要拥有与发展大产业相匹配的博大心胸,更不要“搞山头”,“拉派系”,市场竞争不同于学术讨论,服务市场与广大用户才是实力的最好体现。自“863”计划开始,国家已在语音技术领域投入了巨额的科研基金,也可谓硕果累累,如今几乎所有的语音企业也都多少享受到这些成果,此乃国家远见之举,产业发展之幸!而得到国家直接支持最多的企业或者机构,也应想到,伴随智能语音产业的发展,支持社会产业发展,回馈社会,回馈大众是义不容辞的责任与义务。

  谈到捷通华声未来发展,张连毅表示:“捷通华声将致力发展灵云开放平台,灵云不会发展单一技术能力,将在发挥语音识别、语音合成等多项HCI技术优势的基础上,不断与学术界、产业界合作,推出更多的HCI技术能力,让人机交互像人与人沟通一样的简单自然,促进合作共赢成为HCI产业融入中国IT产业的主旋律。”

  今年,捷通华声灵云已设立1000万发展基金,半年来资金的使用,包括对国内各种HCI技术各种学术会议的支持已取得非常好的效果。如果哪家科研院所、或者企业有新的HCI技术,灵云都可以为其提供平台支持、资金与市场支持,灵云的目标是融合所有成熟的HCI技术,并向社会全面开放,坚定支持中国实现从“中国制造”向“中国创造”的历史性转变。张连毅最后强调说:“相信未来发展,智能语音等HCI技术依然会呈现螺旋式进步趋势,无论智能语音、还是智能图像,抑或生物识别。没有最好,只有更好;只有合作,才会更好!”


  关于张连毅:北京捷通华声语音技术有限公司董事长,清华企业家协会(TEEC)成员。1989年获得清华大学环境工程系学士学位。1990年,与清华大学吴佑寿院士、丁晓清教授合作,推进“863”计划成果汉字印刷体识别系统(OCR)的商品化进程,1992年,受当时国家科委、清华大学委托,创办清华文通公司,专注发展OCR等图像识别技术应用。1992年底至1998年6月赴美学习、工作。1998年8月归国,与清华大学电子系陈明博士创建北京捷通软件技术有限公司,全方位发展HCI技术应用。2000年与中国科学院声学所吕士楠、北京大学顾小凤两位教授共同创建北京捷通华声语音技术有限公司。

  声明:CTI论坛(CTiforum)版权作品,未经CTiforum书面授权,严禁转载,违者将被追究法律责任。

  

分享到: 收藏

专题