首页 > 新闻 > 国内 >

捷通华声灵云:合清华之力推动人工智能

2014-07-28 10:54:24   作者:   来源:CTI论坛   评论:0  点击:


  在微软小冰与微信之间剪不断理还乱的“各说各话”之后,人工智能这个词汇瞬间风起云涌:Google的佩奇、百度的李彦宏等大佬在公开场合大谈人工智能,暗中则在加快无人驾驶汽车和百度大脑的研究进程;微软在用“Adam计划”继续强化自家产品的智能水平;与此同时,国内人工智能技术领军企业捷通华声在为同时提升人机交互能力与计算机的思维能力上跨步前行,不断推动人工智能技术在中国产业中的应用与普及。

  深度学习:人工智能的分水岭

  人工智能是一个由浅入深的智能化模型、机制和过程,在较浅层次上,人工智能意味着智能化的人机交互方式,如智能语音交互,让计算机“能说会听”;智能图像识别,让计算机“能写会看”;在深层次上,人工智能意味着基于机器学习技术的知识表达、归纳、推理等智能计算过程,如语义理解,让计算机明白交流的内容。如果说智能人机交互是人工智能的触角,智能计算则是人工智能的核心,二者缺一不可,共同组成一个智能网络。而深度学习技术的突破,则进一步完善了对人工智能的完整定义。

  在学术界,深度学习是脱胎于深度神经网络(Deep Neural Network,简称DNN)的一个抽象概念,这种算法可以使计算机的认知过程逐层进行、逐步抽象,被称为是“最接近人脑”的复杂模型。吴恩达教授在谷歌大脑项目中的开发使深度学习的强度提高了十倍,并显着提高了语音识别和计算机图形识别的准确率。“人工智能已经失败了无数次,如今它实现了一次超越。” 深度学习领域先驱扬·乐康(Yann LeCun)如此评价。

  如今深度学习在人机交互领域取得更加明显的效果,其巨大的影响更多集中在语音识别上:当谷歌在安卓手机上采用基于DNN的语音识别技术时,它的识别错误率下降了25%;当捷通华声将DNN用来提高“灵云人工智能技术平台”的中文识别水平时,结果是大幅提高了人声和电话通道录音双方面的识别率。DNN对于语音识别的影响可见一斑,立竿见影的增益效果使脱离了Nuance技术支持的苹果也为之心动。

  然而,能从DNN中获得巨大收益的可不止是语音识别。

  Google、百度已经把DNN用于街景地图中的光学字符识别(OCR)以便于识别店铺名称等信息--这对能提供地图搜索服务的企业来说是显而易见的行为。几乎与此同时,钻研OCR多年的捷通华声也在尝试将DNN融入灵云的各项服务,使得文档、票据、证照、名片中的文字信息能在不需要人工校正的情况下准确地“跃然纸上”,在银行、海关、公安、税务等领域得到广泛实际应用。

  “深度学习将全面占领计算机视觉和语音识别领域,并将对机器翻译、网页搜索和对话系统等性能提升有所帮助。”吴恩达教授在做客中国科学院自动化研究所时如是说。

  清华大学:灵云力量的源泉
 

  2006年,加拿大多伦多大学教授、机器学习领域的泰斗杰夫·辛顿(Geoff Hinton)和学生在顶尖学术刊物《科学》上发表了一篇文章,引发了深度学习在学术界和工业界的浪潮。2013年,Google收购了辛顿的研究小组,一下使产业界的目光集中到学术上来。科技公司清醒地意识到,单靠自身实力是不足以在人工智能领域有所建树的,必须依靠学界的研究力量才能打开更广阔的天地。于是,科技公司不但在人工智能上争相投入资源,也开始在学术界招揽辅佐之士。同年晚些时候,Facebook宣布聘请前文提到的扬·乐康掌管人工智能实验室。而后,吴恩达教授也被揽入百度麾下。

分享到: 收藏

专题