首页 > 新闻 > 国内 >

捷通华声“云+端”OCR 再掀智能图像热潮

2014-06-09 14:49:04   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum)6月9日消息(记者 于鑫):2013年炒得最热的不是房地产,而是智能人机交互技术(HCI)在IT圈的极速扩张。国内的互联网大佬代表BAT在搜索、电商、移动等各个领域抢滩攻地,在智能人机交互(HCI)领域炒得更是火爆,从百度首先战略投资国内第一大智能语音技术开发商捷通华声开始,就已打开了智能语音五彩的市场;然而随着2013年沸沸腾腾的语音热潮逐渐退去,2014年图像识别热潮又开始幕天席地而来,其中以OCR技术尤为瞩目。

  OCR(光学字符识别)技术隶属图像识别技术的一支,也是HCI技术领域最早实现商业化的技术,早期多用于办公文档录入与金融、保险等大型企业的票证识别系统,然而近年来随着智能移动端的迅速发展,OCR技术已在潜移默化中从To B端延伸至To C端,被广泛地应用于各个领域、各项软硬件中。

  放眼国外,近日来有iphone6 ios 8系统透露的用户信用卡扫描功能以及微软SkyDrive欲推出的OCR搜索的消息。

  而国内BAT三巨头也马不停地相继推出OCR相关服务和产品,例如百度的涂书笔记、腾讯微信智能开放平台开放图像识别端口、阿里提出的深化手机应用概念。

  这是否预示着2014年将是OCR技术重新迸发活力的一年?

  语音热潮渐消,OCR后浪迭起

  众所周知,2013年是APP全面攻陷国民智能移动端的一年,其中尤以智能语音交互技术炒得轰轰烈烈,在苹果siri引爆语音识别后,国内在这一领域的技术先驱企业捷通华声、讯飞等更是奋力直追,打造出更符合汉语言习惯的智能语音交互技术;而在语音合成(TTS)技术方面,一直作为国内TTS技术领导者的捷通华声更是在2013年因其灵云平台(hcicloud.com)推出十几种国际语言合成技术,满足全球90%地区的语音合成服务而独领风骚。

  然而信息技术瞬息万变,在智能语音刚被推上一个新的关注和应用高度的时候,OCR等智能图像技术又顺势创新应用于各领域,引起业内的广泛关注。

  在国内,OCR技术商品化最早成熟于上世纪90年代,对于行业内人士和金融通信类企业来讲并不陌生,那时多应用于文本自动录入与证件和表格扫描,以便减少人工录入成本。

  然而,现今随着云计算、大数据时代的到来,各行业各领域的单位和开发者对OCR技术的需求也越来越多样化,大至银行海关证照,小到淘宝店主收支票据,而智能移动端的迅速发展正给OCR便捷化、普遍化提供了可能和新的发展机遇。

  OCR再次以其独特的录入方式而成为互联网新的入口,引发了产业界与各大IT大佬的 广泛关注,不断的产品与技术创新比拼,使OCR技术在2014年重又走上了IT舞台的中心,在HCI技术领域,继智能语音之后,一场智能图像领导者的争斗战再次打响。

  捷通华声“云+端”OCR,满足用户多样化需求

  捷通华声OCR首席技术官李健表示:“在国内,OCR技术已发展了数十年,而我们对该项技术的研究也已积累了数十年的调研数据和实践经验,无论是识别率、识别速度、用户界面的友好性,还是产品的稳定性、易用性及可行性等,都足以与国内外IT巨头抗衡。

  自2011年,捷通华声推出国内外第一个全方位HCI技术云服务平台灵云后,灵云OCR系统发挥灵云“云+端”的优势,可满足用户多样化定制需求,为OCR技术的应用提供了比以往任何时候都宽广的发展空间。传统的OCR软件只是通过单一的终端设备,无法联网,应用、操作较单一;而灵云OCR系统则可通过灵云服务全方位拓展应用领域。如:每年我国有众多数字图书馆建设中的大量纸张数据信息,所有银行、税务局、保险公司的大量票据,公安边防海关等部门的各类证照卡数据信息等等,都需要输入到电脑里并做分析存储,几乎可覆盖到国家及各部委的所有重点行业领域。与此同时,新兴的商业及个人应用与服务市场更是一个巨大的市场空白,捷通华声灵云OCR在这一即将成熟的领域已抢占先机。”

分享到: 收藏

专题