您当前的位置是:  首页 > 新闻 > 国内 >
 首页 > 新闻 > 国内 >

普强信息:以技术为核心驱动产业发展

2016-08-22 14:41:50   作者:   来源:CTI论坛   评论:0  点击cti:


  普强信息作为四维图新战略布局重要一环,以“千语”语音识别引擎和“千语千寻”语音分析系统为基础支撑,着眼中国车载语音市场,通过普强信息车载语音助手,使驾驶者彻底解放双手,真正实现让汽车听清楚并理解人类语言,听语音指令进行硬件控制、通信、信息查询,最终实现智能驾驶和车联网。
\
  普强信息CEO何国涛
  眼下是互联网投资最纠结的时刻:智能手机基本普及、互联网+产品不断开发,各行各业都在掀起革命,互联网金融、互联网农业、互联网医疗等等遍地开花,凭着对互联网新技术的敏感和激情,越来越多的投资机构也追逐创业者加入“互联网+”的大军,其背后却是不足10%的创业成功率。领先一步的投资者已纷纷抢占了有利高地,而后续的突进因为过重烧钱没有护城河的模式和讳莫如深看不懂的体制深水纷纷受阻,互联网加了半天还是凑不上去。本来年初VR给诸位打了不少鸡血、仿佛商用指日可待,但现在看来目前的终端tooyoung、恐怕至多也才刚刚达到“塞班的阶段”;而最近一直在提的内容、直播、网红等伴随着政策的收紧、大平台制肘和数据造假的曝光,看起来越来越不像是真正的风口??以上的种种似乎让投资机构们懵圈了,失去了往日的格局和耐心。
  此时,我们不妨用另一个角度来思考投资方向:即纵向深度开发的科技。阿里巴巴,不过是利用现有互联网技术整合现有资源,百度不过是利用现有计算机语言搜索社会既有的资源,腾讯不过是利用现有的技术为人与人的沟通搭建了一个桥梁,从这个意义上讲,这些企业称之为高科技企业真是勉为其难,因为这些所谓的高科技企业虽然改变了人们的生活方式,但也都不过是利用现有的计算技术对现有资源进行的整合,即科技的横向利用。
  那么重点来了:纵向深度开发的科技,相对于横向资源整合的科技来说,更能从根本方式上改变社会的全方面。语音识别,你没看错,语音识别技术正是一项纵向开发的科技,这种语言的发明、发展、完善,以及语音识别技术的深入,必将深度影响人们社会生活的方方面面,同时也将引领社会各行业的新发展。语音识别技术的应用被美国新闻界评为计算机发展十件大事之一。苹果Siri的出现,语音识别技术迈着花哨的小碎步走进大众视野。这种语音识别技术让机器通过识别和理解过程,把语音信号转变为相应的文本或命令,从而解放双手和眼睛,实现随时随地的人机交互。在未来商业领域,语音识别技术将逐步进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域,并且最终会成为人工智能的一项基础科技。
  语音识别技术作为科技纵向开发的一项科技手段,成为人工智能和机器学习应用的一个重要方向,并将发展为一个具有广阔前景的新兴高技术产业,具有敏锐嗅觉的商业巨头们也在加速语音识别行业的布局。普强信息作为一家以智能语音识别和语言处理技术产业化为主要发展方向的新锐科技公司,成立于2009年美国加州硅谷,2010年于北京中关村设立中国运营公司,其业务定位是以中文为主的智能语音和语言核心技术的提供商、应用方案提供商、云平台服务提供商。经过几年时间的潜心研发和积累,普强信息正在成为众多商业领域应用中不可小觑的龙头企业,其发展趋势和市场份额的井喷式增长,似乎预示着其角逐中国语音识别领域皇冠的决心。
  技术为王
  普强信息的创始人兼CEO,何国涛可谓是技术研究出身的管理人,作为一个具有管理上亿元营收公司规模又具有跨国技术经验的美籍华人,何国涛先生在普强信息创立伊始,就将目光锁定在中国刚刚起步的语音产业,并将“核心技术的研发”视为企业发展之灵魂。“之前普通大众对普强信息的熟知度并不高,普强信息从成立到现在已经成功走完了初级阶段,这一时期我们专心做的是技术研发、定制化应用以及市场拓展,只是踏踏实实的做好技术提升和专业服务。”企业以此为经营理念的前提下,何国涛携手联合创始人李全忠博士(现任普强信息CTO,负责公司语音识别及语音分析技术)蒲瑶女士(现任普强产品副总)开启了中国语音行业的征程。
  普强信息在硅谷和中关村均建设有技术研发中心,集合了语音识别、语言处理和云计算技术领域世界级专家,拥有一流的研究及工程团队。研发团队占公司人员的80%左右,其中博士、硕士以上占团队人员30%以上。
  何国涛向《融资中国》记者介绍到,除此强大技术团队之外,普强信息还与多名国内外技术领域专家以“技术顾问”形式展开合作,共同保障技术的领先性和前沿性。据了解,技术顾问大多来自国内外知名大学从事语言学研究领域的专家,他们研发的成果大多被谷歌、微软等科技巨头公司所采用,技术方面的投入和研发正在为企业提供源源不断的发展动力和商业价值。
  核心产品
  “千语”语音识别引擎和“千语千寻”语音分析系统是普强信息自主研发的核心产品,普强信息拥有其全部的知识产权和专利。针对不同的行业,普强信息进行垂直化定制服务,除了可以支持大词汇量连续语音在线识别等语音服务外,还可以根据企业特有的应用环境优化识别模型和相关语音服务定制。其语音模型和声学模型业务覆盖金融、保险、银行、电商、教育、政府、运营商等行业,并提供定制化的SDK和接口调用。在中文系统的研发领域,普强信息已经达到国际领先水平。“一些国际型巨头公司可能会有多语言的语音识别,普强信息专攻中文语音领域的识别和分析,要好于国内外技术水平。在某些技术上,与科大讯飞基本属于持平状态,在一些方面,甚至优于国内龙头企业。”何国涛介绍说,普强信息全文识别率可达85%以上,关键词识别率达95%以上。
  语音平台是构建一个可扩展的大数据分布式语音数据处理的平台。该平台既可以部署在一台服务器上运行,也可以扩展到几百台服务器上分布式运行,其设计思路一开始就是针对处理大量的语音数据。基于此项设计特点,该系统的很多组件都经过精心设计,可以轻易扩展到分布式模式,以便减轻核心系统的负担。系统中被经常调用的部件也经过优化,使其对系统资源的占用减至最少,让系统具备良好的封装性和可扩展性。
  “‘数据’已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”何国涛向《融资中国》记者介绍说,在大数据的浪潮下,联络中心的客户关系管理变得从未有过之近,也从未有过之重。企业借助普强信息的“千语千寻”语音分析系统,对联络中心庞大的客户对话录音内容进行全面质检和挖掘分析,感知客户情感倾向,建立客户主评测模型和外呼实践知识应用管理体系,在激烈市场竞争中迅速出击。
  “千语千寻”360度语音大数据分析系统建立的更深层意义在于支持数据的深度挖掘,具有对话信息分割、语速信息、静音时长、识别可信度、声纹信息、音素信息、时间边界、情绪分析等功能,将运营中心座席与客户的对话实时接入千寻系统的算法和模型,不仅能将不同地域口音的来电转换成文字,还能根据不同的系统用户需求,标注出关键用词。这一分析系统支持市场上主要厂家的录音系统,既可以实时接入,也支持批量导入。该系统在识别率和处理速度上稳居于行业优先水平,目前公司客户覆盖金融、保险、汽车、教育、互联网、政府、运营商等行业。目前,北京银行、招商银行、招商信诺、华安保险、中荷人寿、众泰汽车、北汽、四维图新、世纪高通、尚德教育、奇虎360、酷我音乐盒、我的南京、中国电信、中国移动、中国联通、联想等国内外著名企业已经和普强信息建立了合作关系。
  产品优势成就企业价值,普强信息是全球领先的中文语音及语言技术提供商,作为技术原厂商,可保证项目达到最好的核心效果,公司具有中国大陆地区最好的语音分析、文本产品咨询顾问,具有丰富的行业应用案例,以及项目管理经验;庞大的本地化技术团队,从核心到应用均为自主研发,可快速根据客户的实际业务优化语音识别效果和系统二次开发。
  公司成立七年来,普强信心语音识别技术和应用已经在合作客户企业中产生了强效应。据可依据资料可以看到一组数字:通过将所有结构化和非结构化(录音数据、随路数据)的数据标签进行整合化分析,打造所有数据的可视化分析,为运营中心各类人员提供基于客户心声的360度视图分析数据利用率达到100%;通过对所有录音的自动识别分析,各级质检、运营、营销、管理人员的工作效率提升16倍;通过对业务(话术)流程的改进,使各项营销业务的成单转化率提升10%;通过对坐席服务能力和业务能力的改善,使客户流失率降低5%;通过超长通话分析、重复来电分析、静音时长分析降低来电量和平均通话时长,转人工来电量降低3%,平均通话时长降低10S左右。
  普强信息通过语音识别和语音分析领域的深耕,目前拥有其全部的知识产权和专利,其研发的多种语音技术均是业界领先的技术,目前已经获得9项国家专利,13个计算机软件着作权登记证书并参与制定2国家行业标准。
  车载语音助手
  普强信息作为四维图新战略布局重要一环,以“千语”语音识别引擎和“千语千寻”语音分析系统为基础支撑,着眼中国车载语音市场,通过普强信息车载语音助手,使驾驶者彻底解放双手,真正实现让汽车听清楚并理解人类语言,听语音指令进行硬件控制、通信、信息查询,最终实现智能驾驶和车联网。对于这一目标的胸有成竹,普强信息的自信和底气来自于与四维图新的战略合作。
  从2011年四维图新首次成为普强信息的合作伙伴,到2015年普强信息再度获得由四维图新领投的新一轮融资,从另一个侧面看到了双方在全面布局车联网领域布局的决心和普强信息的竞争力优势。通过四维图新的战略布局,针对智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子系统企业的布局,形成产业链闭环和强有力的壁垒,普强已经把车载语音做到了同属四维旗下的杰发科公司的公版上,完成了芯片级语音的第一步。
  普强信息把注意力放在通话、导航和音乐等最基本的功能上,确保这些功能在驾车环境中稳定而可靠,把在智能手机上非常熟悉的应用和界面搬上车载显示屏,整合各个汽车厂商定制的操控功能,采用智能语音技术进行智能化控制;针对车载语音识别由于容易受到外部环境噪音、引擎噪音和车内环境噪音影响,普强信息在降噪技术上,一方面使用了DSP降噪芯片进行硬件去回声降噪,另一方面通过定制化采集不同车型上的胎躁,发动机噪音,风噪等噪音数据训练声学模型,进行软件降噪;同时还有2-4个的阵列硅麦麦克风方案,实现声源定位和声源追踪的功能。
  随着公司不断的积累,语音识别的技术和产品都相应获得了全方面领先优势的发展。在产品的声学建模上,开发使用了深度神经网络技术;公司研发的语音切分技术及识别结果的置信度算法,不但为企业级应用提供准确的识别结果,同时也提供了精确的说话人分割、时间边界以及识别结果的置信度等信息,这些信息使企业在应用中,更加便捷和准确地利用语音作为主要的交互方式,并且可以进一步挖掘、分析和利用海量语音数据的内容。
  高科技+互联网的生活总是让生活变得简单、智能。车载语音助手针对驾驶环境设计最人性化交互体验,保证驾驶安全的同时又可以用最自然的语言进行打电话、导航、音乐等。在未来,只要你对它说你要的命令,普强语音助手就可以理解并执行,既可收听股市、查询天气、周边查询、还能新闻阅读、车辆控制等。未来,通过普强信息与客户需要的深度整合,车载语音助手可通过车窗,座椅加热等接口开放进行控制。
  对于语音识别技术,口音和方言一直是其挑战的诟病。普强信息主攻技术为中文识别,语音分析系统在大数据语音分析的时候,积攒了大量的口音数据,目前市场上见到的口音基本都已经支持,针对个别方言需求也可以进行定制开发。
  普强智能车载语音助手意在解决驾驶员的“手忙脚乱”,从前装客户提供完整、高效的车载语音交互,帮助车主实现真正的“全程脱屏”,并立足于前装市场的云+端+芯方案,打造世界最好的中文车载语音交互系统。
  未来发展趋势
  语音识别技术最早起源于1960年,英国的Denes等人研究成功了第一个计算机语音识别系统,开启了人类与机器人的奇幻旅程。1986中国高科技发展计划(863计划)启动,中国开始了有组织的语音识别技术的研究,从此中国的语音识别技术进入了一个前所未有的发展阶段。
  翻开人类语音识别发展历程,不得不提国际巨头Nuance,这家公司拥有世界上超过80%的语音识别,曾经在语音领域具有一统江湖的地位,几乎垄断了全世界金融和电信行业。就算现在Nuance依旧是全球最大的语音技术公司,掌握着全球多语种的语音技术专利。苹果的Siri算是鼎鼎大名了,其技术经过并购、研发逐渐走向成熟,算世界上语音识别的执牛耳者。除此之外,国际巨头微软、谷歌、Facebook、Amazon等更多大佬纷纷布局全球市场。
  风景这边独好,随着国内创业热潮和资本驱使,国内语音市场近年来进入加速跑时期。面对未来市场的商业价值,每个人都想在巨大蛋糕前分得钵满盆满。
  科大讯飞是目前国内最有影响力的语音技术公司,成立于1999年,在2008年挂牌上市目前市值接近500亿,根据2014年语音产业联盟的数据调查显示,科大讯飞占据了国内超过60%的市场份额,绝对是国内语音技术的龙头企业;百度也在很早将语音确立为战略方向;搜狗开始采用云知声的语音识别引擎;但很快就搭建起自己的语音识别引擎。腾讯当然不会落后,微信也建立了自己语音识别引擎,用于将语音转换为文字;阿里,爱奇艺,360,乐视等等也都在搭建自己的语音识别引擎。
  未来的语音识别市场,预计将会有越来越多的公司参与,未来语音识别的性能可能更多的体现在前端技术和语义理解上。机器要与人自然交流,当然就不能重复手机这套语音对话规则,必然就要考虑到用户说话的环境、周围环境的噪音、用户发音不准或者方言等等诸多因素,这就要求前端技术更加精准的模拟人体结构,仿真出机器人听觉系统,以实现解放双手自由对话的目的。在这些方面,普强信息的技术水平已经走在了国内前沿。
  语音识别行业属于声学和计算机的交叉技术,立足时代发展和科技进步,普强信息以技术为核心竞争力,真正实现语音从识别到交互的自然体验。不仅实现将语音转换成文字,更专注于机器从文字中理解说话人的含义,从而向穿戴设备、智能家居、机器人等领域进军,打造专业的行业地位,带动人类向人工智能迈进一步。

专题