普强信息:语音识别领域的“潜行者”

2014-08-06 14:00:00   作者:   来源:CTI论坛   评论:0  点击:


  语音分析系统相比传统的人工分析的优势

  语音分析系统的优势主要有以下几个方面:

  1. 数据覆盖更全:很显然,智能语音分析人工分析工具所难以比拟的数据覆盖性,语音分析可以做到100%覆盖,但人工分析一般抽样比例低于5%.

  2. 数据处理能力更强:相比于人工分析,智能语音分析数据处理能力更高,每一个CPU线程每一小时可以处理分析2.6小时的录音,而人工分析每人每一小时只能处理分析0.4小时的录音。一般标配服务器为16核CPU,一般等同于104人。(Elwin,这里需要说得更简单直白一些,“一般标配服务器16和CPU,一般等同于104人”,具体是什么意思?)

  3. 具有精确的分析功能:语音分析可以通过聚类算法知道热点业务、高频词汇;同时也可以通过筛选算法,在几秒钟内就可找到目标数据,而人工分析无法处理大数据量计算统计工作。

  4. 更具智能性:语音分析可以进行大数据量的统计计算,从而找出中间的具有某个特定特性的集合,并且分析集合间的相关性,而人工分析无法进行大数量的计算。

  5.自动性:语音分析可以事先预设统计规则,并设置回溯期的数据重新统计计算,人工无法将历史数据采用新算法计算。

  6.统计计算工具:语音分析具备大量的数据挖掘和分析工具,人工分析只能做简单的计算统计。

  语音识别领域落后欧美发达国家 但发展空间广阔

  在中文语音识别领域,国内的科研院所及公司的数据积累要远远多于国外的同行,因此在中文的识别准确度上要好于国外。国内技术型创业公司(包括普强)在研发和利用新技术方面有很大的灵活性,站在技术的前沿,这同时也提高了国内语音技术在国内的产业化水平。在企业应用市场方面仍然落后于欧美的发达国家,但是目前处于迅速跟进和快速发展的阶段,这给语音产业的创业公司尤其是面向企业市场的公司提供了广阔的市场空间。

  加强研发 投资多个领域

  在技术方面,从简单的声音模板匹配,到GMM/HMM,再到DNN/HMM每个新技术的发展都能给ASR的准确率带来一个飞跃,但仍然有很多问题需要解决,比如适应各种环境的噪音,尤其是含有人声的背景噪声、口音及方言的识别、以及在嵌入式设备中降低功耗等。普强会继续投入大量的资源去解决这些问题。以保证普强在技术上的领先地位。

  ASR可应用在很多不同领域。包括:企业呼叫中心,车载导航领域、教育领域、玩具领域、声纹识别领域和医疗保健领域等。普强的自主专利核心技术都可以支持这些领域。目前,我们集中资源在企业呼叫中心和移动互联网领域。我们的产品在这一领域有明显的优势,会继续投资现有的领域,同时也会在此领域继续加大投入以保持我们的优势,当然,也会投入在车载、教育等领域来建立技术屏障。

相关阅读:

分享到: 收藏

专题