普强信息:语音识别领域的“潜行者”

2014-08-06 14:00:00   作者:   来源:CTI论坛   评论:0  点击:


  ·医疗保健领域:应用到电子病历中,可自动实现把医生的声音转换成文本。这一领域也是若干发达国家在语音识别的主要收入领域。

  由于拥有领先的语音识别技术,普强已经做好了进入这些领域的准备。普强将先锁定在企业客户这块。当我们在这个领域做到最好时,我们再继续渗透到其它版块。

  普强目前拥有:

  千语语音平台:向企业提供语音识别服务

  千语语音云平台:为手机互联网应用提供的语音识别云服务

  普强智能语音分析系统:为企业提供360度大数据分析(语音,视频,文学数据等)

  突破ASR语音识别技术难点 应用于可穿戴设备

  语音识别技术要求快速,准确。语音识别目前还达不到百分百准确,达到完美的距离还很远。因为中文5千字中发音有406个,是最难辨识的语种,例如(wu),可以是吴、无、吾、梧、蜈等。同样文字各地方言发音不一,便会增加难度,所以语音辩识应用的成功关键,更倾向是专业能力。人类有眼睛,耳朵,文字来帮助识别,语音识别是只通过能“听”来完成,有限的声音数据要用来识别声音的同时也要区分不同的背景杂音,需要花时间和精力去完善核心算法和积累数据。为了使每个垂直领域达到最优的识别效果,我们都需要积累经验去适当调整算法和采集选择数据,例如为呼叫中心的电话信道建立模型与移动互联网的声学模型是不一样的。

  在可穿戴设备上,语音识别技术将是必备技术之一,但是要应用ASR技术到可穿戴设备,我们首先要解决能耗问题,这类设备一般没有太多电能。

  一个成功的案例是:低功耗的语音唤醒技术。它通过只针对特定人和少数命令词的识别解决了低能耗的问题,成功应用在许多嵌入式产品中,例如:手机语音唤醒,宠物语音锁链(锁链回答宠物主人的叫唤)等。

  CEO:何国涛先生

  北京大学计算机硕士,美国雪城大学计算机硕士。曾在HP、Aruba等公司从事Opencall、Voice XML、 无线网关等产品的开发和研究,并成功地在世界500强公司产品中部署应用;在语音领域拥有三项专利和一 项待批专利。兴趣和专长包括语音识别技术、呼叫中心、无线网络等。

  CTO:李全忠博士

  北京大学计算机硕士,美国亚利桑那大学计算机博士。曾在IBM Almaden研究中心担任研究员, 从事 数据库及云计算研究;荣获过IBM发明成就奖,拥有多个专利并且在顶级互联网及数据库期刊上发表过 多篇论文。兴趣和专长包括大规模数据处理、数据库和云计算等。

相关阅读:

分享到: 收藏

专题