首页   新闻  文摘   行业   产品  技术  厂商  标准  BBS  导航  搜索
呼叫中心 | CRM | 统一通信 | 企业通信 | VoIP | 视像通讯 | 语音应用 | 热点专题

首页>>厂商>>语音识别与合成>>得意音通

国际领先的“得意”声纹识别引擎

2005/07/20

  得意公司的声纹识别引擎(d-Ear VPR)包括声纹辨认版本和声纹确认版本,可以是文本无关的,也可以是文本相关的,而且均支持开集的识别方式。其中文本无关的版本同时具有文本和语言的无关性,对语音长度的要求也非常低,通常训练只需要几十秒有效语音,而识别阶段只需几秒钟的有效语音即可。有很高的识别精度,也可以灵活地调整操作点参数从而适应于不同应用的需求。

"得意"声纹识别引擎具备以下技术特征:
  1. 对声纹的识别与所说的文本和语言无关性。用户训练系统和系统对用户的声音进行鉴别和确认,可以是完全不同的文本,完全不同的语言。比如,在用户在系统注册声音时,可以使用中文说一段文学章节,而识别时用户可以用英文谈论计算机的发展方向。

  2. 对语音长度没有特殊要求。训练语音最长8秒,使用时的测试语音2-4 秒,并可不断累积调整声纹模型精度;用户训练系统,让其记住其声纹,只需要几秒种的声音;而在识别时,系统只要获得被测试人几秒的声音,就可以进行声纹识别。

  3. 很高的精度。d-Ear VPR技术的辨认和确认准确度都很高,说话人辨认的正确率不小于99%;说话人确认的误识率和误拒率均低于1%;

  4. 识别速度快,能确保实时识别。声纹识别引擎具有十倍以上的实时率,可多路并发识别,即10秒的语音片断,引擎1秒内就可以处理完成。

  5. 操作点调整方便:根据"准确率+不确定率+错误率=100%",可按不同的应用需求调整操作点阈值,使最终准确率达到最高或使错误率降到最低。

  6. 声纹模型存储空间小:每个人的声纹模型存储空间小于5KB。

  7. 高安全性,不怕录音冒用:如果别人用各类录音设备(比如录音机、MP3、录音电话、窃听器、高精度的专业录音系统等)事先录下您的声音,即使录音设备很先进、录音效果非常好,在把录音回放尝试进行声纹身份认证时,声音信号经过模拟到数字、再从数字到模拟的两次信号转换过程,声音的频谱就会有明显的衰减和失真,这种失真很容易被声纹加密锁的认证程序分辩出来。所以依靠录音去尝试登录,不能通过声纹认证,也就是说,通过录音不能冒用身份。


"得意"声纹识别技术与其他声纹识别技术的比较

 
得意声纹识别技术
其他声纹识别技术
1 具文本无关性,确保了身份确认的安全性和用户的方便性
  对声纹的识别与所说的文本和语言无关,用户训练系统和系统对用户的声音进行鉴别和确认,可以是完全不同的文本,完全不同的语言。比如,在用户在系统注册声音时,可以使用中文说一段文学章节,而识别时用户可以用英文谈论计算机的发展方向。
与文本相关,安全性和使用方便性都显不足
   对声纹的识别与所说的文本和语言相关,用户训练系统和系统对用户的声音进行鉴别和确认,必须是完全一致的文本,使用相同的语言,容易导致口令的外泄。
2 对语音长度没有特殊要求,方便实际的应用
   使用时的测试语音2-4 秒,并可不断累积调整声纹模型精度;用户训练系统,让其记住其声纹,只需要几秒种的声音;而在识别时,系统只要获得被测试人几秒的声音,就可以进行声纹识别。
要求进行特定的语音训练,用户需跟着朗读和学习,方便性和实用性不强
3 很高的精度
   得意的技术辨认和确认准确度都很高,说话人辨认的正确率不小于99%;说话人确认的误识率和误拒率均低于1%
精度一般
  识别精度约为90%,误识率和误拒率相对较高
4 操作点调整方便
  可根据实际情况和环境,按不同的应用需求调整操作点阈值,使最终准确率达到最高或使错误率降到最低。
没有操作点调整功能
  不同用户和不同的环境使用只能使用同一模型,不能确保高的安全性和准确率
5 声纹模型存储空间小
   每个人的声纹模型存储空间小于5KB,能可靠地存储于加密钥匙内,与硬件紧密结合能最高程度地保证系统的安全性,防止非法的攻击和窃取
声纹模型存储空间小
   不能存储于加密钥匙内,没有硬件的保护,不能有效防止非法的攻击和窃取

得意音通公司供稿 CTI论坛编辑



  ·Polycom 极致高清视频会议体验活动---免费获赠万元奖品
  ·“呼动中国”:东进技术多媒体呼叫中心招募增值渠道合作伙伴

  ·招聘:商路通 怡海软件 正音科技 上海宝东 东进通讯 亿迅(中国)

  ·《2008中国呼叫中心产业发展研究报告》正式出版 2008-8-25  
  ·最新资料:《企业呼叫中心建设指南》 《企业通信案例及方案大全》
  ·免费索取:《多媒体交换机资料》   技术前沿资料:《IP、无线和视频方案》


  ·新太科技企业呼叫中心解决方案
  ·TTS在线演示:InterPhonic 5.5系统
  ·IP分布式呼叫中心在各行业应用

            


企业会员
易宝通讯 三汇软件 陕西公众信产公司
拓敏信息 卓大兴业 正音科技
加入办法 ->





CTI论坛推荐
·鼎晟DS-iTouch联络中心
·新太科技企业呼叫中心解决方案
·上海维卡推出VN系列电话语音卡
·CTstage 5i客户联络中心-适用大规模分散网点
·三友亚星:上海红孩子电话营销和客服系统
·什么是IP分布式呼叫中心
·语音合成:InterPhonic 5.5在线演示系统
·东进技术:Seegoe Enterprise/Office呼叫中心
   
相关链接
CTI论坛周刊 融合通信专栏
行业案例汇编 免费发布新闻
管理员俱乐部 服务与营销论坛

热 点 专 栏
|业界新闻|论坛文摘|行业应用|产品展示|技术天地|厂商汇总|免责声明|咨询服务|公司简介|联系方法|广告服务|企业会员|

编辑投稿信箱      如何查找厂商联系方法

电话:010-82012787,82079677   传真:010-62041062
呼叫中心建设及运营管理咨询服务:优胜资讯(010)87768798 87768726