首页   新闻  文摘   行业   产品  技术  厂商  标准  BBS  导航  搜索
呼叫中心 | CRM | 统一通信 | 企业通信 | VoIP | 视像通讯 | 语音应用 | 热点专题

首页>>厂商>>语音识别与合成>>捷通华声

捷通华声推出OSR语音识别技术

2004/09/30

  北京捷通华声语音技术有限公司与美国 ScanSoft 公司( Nasdaq :SSFT ),于2004 年5月20日,就双方语音技术全面合作达成战略联盟,此国际合作联盟旨在共同推动国际语音产业的发展,加速中国语音技术产业化发展进程。2004年9月,捷通华声在国内正式推出ScanSoft国际最高水平语音识别技术OSR(OpenSpeech Recognizer )

  之所以称之为OSR,是因为此项语音识别技术是一种基于开放标准、可扩展、高性能和高识别率的识别引擎,提供大词汇量、非特定人、连续的语音识别功能,尤其是在各种无限环境之中对于噪杂音的处理功能强大。OSR产品将以SDK的方式提供给集成商,可广泛应用在呼叫中心、自动总机、语音电话本、旅行预定、信息检索、语音门户和客户自助服务等系统中。

  捷通华声与ScanSoft公司强强联手,将捷通华声中文语音合成技术与ScanSoft公司最新语音识别技术OSR全面整合,形成完整的语音技术解决方案以利于国内、国际语音技术市场的广泛应用,使产品更加贴近用户需求,更好的满足市场需要。

一、Scansoft公司介绍:

  美国 ScanSoft 公司 (Nasdaq: SSFT) 是一家全球知名的国际性企业,是专业的语音和图像解决方案供应商,特别是其语音识别引擎,在识别率、识别速度、系统稳定性等方面都处于行业领先的地位,在通信、远程信息处理、移动终端等诸多领域有着广泛的应用,市场遍布全球。伴随语音产业在全球的的快速发展,ScanSoft 公司高瞻远瞩,以雄厚的实力、果断的行动在两年之内兼并了 L&H ( Dragon ), SpeechWorks 两家欧洲与美国的实力雄厚的国际知名语音技术公司,并成功收购飞利浦语音实验室,建立了其在国际语音识别技术最大的市场份额。

二、OSR主要特点:

1、高识别率
  OSR产品核心技术显著提高,并且极大的提高置信得分的准确度,使实际应用中识别率均达到95%以上,对于小词汇量的应用识别率更高。

2、强大的语法分析功能
  OSR产品支持百万词汇的复杂语法应用,利用SpeekFreely技术还可支持自然语言问答式的语法识别。利用OSR的先进语法处理能力,用户可以利用ECMA脚本语言书写更复杂的语法,可以创建动态的应用,并具支持共享语法,大幅度提高系统效率。

3、独特的语音端点检测技术
  OSR包括鲁棒的端点检测算法,可以依据振幅和频谱特征来进行检测,从而有效地区分背景噪音和通话者的语音。OSR端点检测的"灵敏度"可以被手动调整,以适应安静或喧闹的不同环境,或在应用中微调性能。

4、适应性强
  通过ScanSoft具有专利技术的自动调节机制"LEARN"学习功能,系统可以自动调节识别参数和声学模型,以适应呼叫人群的本地方言、区域口音和电话信道等特点。通过"LEARN"自动调节机制,识别错误率可以下降70%。

5、高性能、低资源消耗
  独特的音频分析方法及具有专利的有限状态转换技术,使OSR产品在实际应中,内存占用和CPU的消耗极低。对于复杂的语法应用可以节约90%的资源。

6、高容量并发
  OSR产品支持高容量的并发呼叫,一个中等应用(2000词汇以内),至强单CPU 2.4G的配置环境下,可以支持60个并发的语音识别端口。

7、支持开放标准
  OSR产品是根据VoiceXML设计的,对SRGS(Speech Recognition Grammar Specification,语音识别语法规范)的支持等特点使VoiceXML 和 SALT 应用达到最优状态。

8、支持多语言,包括多语言混合识别
  OSR产品目前提供15种语言和方言,包括:普通话(中国大陆、台湾)、粤语(香港地区)、英语(澳大利亚、新西兰、英国、美国、新加坡)、法语(法国、加拿大)、德语(德国)、日语(日本)、韩语(韩国)、西班牙语(美国、墨西哥)。

  OSR产品的WorldAware功能支持多语种的混合识别,甚至允许单个语句中的任意语言混合,可以用于构造更加复杂的语音解决方案。

9、多种体系结构选择
  OSR产品提供多种体系结构组合方式:
  1)单机:用户可以直接在运行IVR的机器上加载OSR。
  2)客户端/服务器:用户可以直接在服务器端加载OSR,客户端通过网络发送语音信号并获取识别结果。
  3)VoIP:用户也可以在一个基于VoIP的客户端/服务器架构中配置OSR,在这种情况下,客户端是一个VoIP媒体网关或媒体服务器,服务器是MRCP版本的OpenSpeech服务器,它提供了带有标准的VoIP协议接口的OSR。

10、支持多种操作系统
  OSR可在下列操作系统下使用单机和客户端/服务器配置:
  客户端操作系统:RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003。
  服务端操作系统:RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003、Solaris。

三、配置要求:

词汇量 运行系统 硬件环境 可支持端口数
2000以下 Windows 2000以上 至强双CPU 2.4G;1G以上内存,20G硬盘;100M以上网卡; 120线
40000以下 Windows 2000以上 至强双CPU 2.4G;1G以上内存,20G硬盘;100M以上网卡; 60线


四、OSR语音识别技术应用案例:

  美国联合航空(United Airlines):客户通过致电1(800)824-6200,应用OSR语音识别技术可方便查询联合航空公司每天2400个航班的状态,每天有8万多人使用这一系统。

  AOL电话服务:采用Scansoft OSR等语音技术,为America Online的2400万客户开发和部署了语音门户服务。

  Thrifty汽车租赁:Thrifty租车公司是全球最大的的租车公司之一,通过拨打Thrifty的1-800-THRIFTY预订电话号码,客户在应用OSR语音识别技术获得高效服务的同时,也获得最优惠的汽车租用费率。

捷通华声公司供稿 CTI论坛编辑



  ·Polycom 极致高清视频会议体验活动---免费获赠万元奖品
  ·“呼动中国”:东进技术多媒体呼叫中心招募增值渠道合作伙伴

  ·招聘:商路通 怡海软件 正音科技 上海宝东 东进通讯 亿迅(中国)

  ·《2008中国呼叫中心产业发展研究报告》正式出版 2008-8-25  
  ·最新资料:《企业呼叫中心建设指南》 《企业通信案例及方案大全》
  ·免费索取:《多媒体交换机资料》   技术前沿资料:《IP、无线和视频方案》


  ·IP分布式呼叫中心在各行业应用
  ·鼎晟DS-iTouch联络中心
  ·东进Seegoe Enterprise/Office呼叫中心产品介绍

            


企业会员
易宝通讯 三汇软件 陕西公众信产公司
拓敏信息 卓大兴业 正音科技
加入办法 ->





CTI论坛推荐
·CTstage 5i客户联络中心-适用大规模分散网点
·三友亚星:上海红孩子电话营销和客服系统
·什么是IP分布式呼叫中心
·语音合成:InterPhonic 5.5在线演示系统
·东进技术:Seegoe Enterprise/Office呼叫中心
·HXD09可编程智能语音交换机
·鼎晟DS-iTouch联络中心
·新太科技企业呼叫中心解决方案
   
相关链接
CTI论坛周刊 融合通信专栏
行业案例汇编 免费发布新闻
管理员俱乐部 服务与营销论坛

热 点 专 栏
|业界新闻|论坛文摘|行业应用|产品展示|技术天地|厂商汇总|免责声明|咨询服务|公司简介|联系方法|广告服务|企业会员|

编辑投稿信箱      如何查找厂商联系方法

电话:010-82012787,82079677   传真:010-62041062
呼叫中心建设及运营管理咨询服务:优胜资讯(010)87768798 87768726