首页>>厂商>>语音识别与合成>>捷通华声

捷通华声推出OSR语音识别技术

2004/09/30

  北京捷通华声语音技术有限公司与美国 ScanSoft 公司( Nasdaq :SSFT ),于2004 年5月20日,就双方语音技术全面合作达成战略联盟,此国际合作联盟旨在共同推动国际语音产业的发展,加速中国语音技术产业化发展进程。2004年9月,捷通华声在国内正式推出ScanSoft国际最高水平语音识别技术OSR(OpenSpeech Recognizer )

  之所以称之为OSR,是因为此项语音识别技术是一种基于开放标准、可扩展、高性能和高识别率的识别引擎,提供大词汇量、非特定人、连续的语音识别功能,尤其是在各种无限环境之中对于噪杂音的处理功能强大。OSR产品将以SDK的方式提供给集成商,可广泛应用在呼叫中心、自动总机、语音电话本、旅行预定、信息检索、语音门户和客户自助服务等系统中。

  捷通华声与ScanSoft公司强强联手,将捷通华声中文语音合成技术与ScanSoft公司最新语音识别技术OSR全面整合,形成完整的语音技术解决方案以利于国内、国际语音技术市场的广泛应用,使产品更加贴近用户需求,更好的满足市场需要。

一、Scansoft公司介绍:

  美国 ScanSoft 公司 (Nasdaq: SSFT) 是一家全球知名的国际性企业,是专业的语音和图像解决方案供应商,特别是其语音识别引擎,在识别率、识别速度、系统稳定性等方面都处于行业领先的地位,在通信、远程信息处理、移动终端等诸多领域有着广泛的应用,市场遍布全球。伴随语音产业在全球的的快速发展,ScanSoft 公司高瞻远瞩,以雄厚的实力、果断的行动在两年之内兼并了 L&H ( Dragon ), SpeechWorks 两家欧洲与美国的实力雄厚的国际知名语音技术公司,并成功收购飞利浦语音实验室,建立了其在国际语音识别技术最大的市场份额。

二、OSR主要特点:

1、高识别率
  OSR产品核心技术显著提高,并且极大的提高置信得分的准确度,使实际应用中识别率均达到95%以上,对于小词汇量的应用识别率更高。

2、强大的语法分析功能
  OSR产品支持百万词汇的复杂语法应用,利用SpeekFreely技术还可支持自然语言问答式的语法识别。利用OSR的先进语法处理能力,用户可以利用ECMA脚本语言书写更复杂的语法,可以创建动态的应用,并具支持共享语法,大幅度提高系统效率。

3、独特的语音端点检测技术
  OSR包括鲁棒的端点检测算法,可以依据振幅和频谱特征来进行检测,从而有效地区分背景噪音和通话者的语音。OSR端点检测的"灵敏度"可以被手动调整,以适应安静或喧闹的不同环境,或在应用中微调性能。

4、适应性强
  通过ScanSoft具有专利技术的自动调节机制"LEARN"学习功能,系统可以自动调节识别参数和声学模型,以适应呼叫人群的本地方言、区域口音和电话信道等特点。通过"LEARN"自动调节机制,识别错误率可以下降70%。

5、高性能、低资源消耗
  独特的音频分析方法及具有专利的有限状态转换技术,使OSR产品在实际应中,内存占用和CPU的消耗极低。对于复杂的语法应用可以节约90%的资源。

6、高容量并发
  OSR产品支持高容量的并发呼叫,一个中等应用(2000词汇以内),至强单CPU 2.4G的配置环境下,可以支持60个并发的语音识别端口。

7、支持开放标准
  OSR产品是根据VoiceXML设计的,对SRGS(Speech Recognition Grammar Specification,语音识别语法规范)的支持等特点使VoiceXML 和 SALT 应用达到最优状态。

8、支持多语言,包括多语言混合识别
  OSR产品目前提供15种语言和方言,包括:普通话(中国大陆、台湾)、粤语(香港地区)、英语(澳大利亚、新西兰、英国、美国、新加坡)、法语(法国、加拿大)、德语(德国)、日语(日本)、韩语(韩国)、西班牙语(美国、墨西哥)。

  OSR产品的WorldAware功能支持多语种的混合识别,甚至允许单个语句中的任意语言混合,可以用于构造更加复杂的语音解决方案。

9、多种体系结构选择
  OSR产品提供多种体系结构组合方式:
  1)单机:用户可以直接在运行IVR的机器上加载OSR。
  2)客户端/服务器:用户可以直接在服务器端加载OSR,客户端通过网络发送语音信号并获取识别结果。
  3)VoIP:用户也可以在一个基于VoIP的客户端/服务器架构中配置OSR,在这种情况下,客户端是一个VoIP媒体网关或媒体服务器,服务器是MRCP版本的OpenSpeech服务器,它提供了带有标准的VoIP协议接口的OSR。

10、支持多种操作系统
  OSR可在下列操作系统下使用单机和客户端/服务器配置:
  客户端操作系统:RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003。
  服务端操作系统:RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003、Solaris。

三、配置要求:

词汇量 运行系统 硬件环境 可支持端口数
2000以下 Windows 2000以上 至强双CPU 2.4G;1G以上内存,20G硬盘;100M以上网卡; 120线
40000以下 Windows 2000以上 至强双CPU 2.4G;1G以上内存,20G硬盘;100M以上网卡; 60线


四、OSR语音识别技术应用案例:

  美国联合航空(United Airlines):客户通过致电1(800)824-6200,应用OSR语音识别技术可方便查询联合航空公司每天2400个航班的状态,每天有8万多人使用这一系统。

  AOL电话服务:采用Scansoft OSR等语音技术,为America Online的2400万客户开发和部署了语音门户服务。

  Thrifty汽车租赁:Thrifty租车公司是全球最大的的租车公司之一,通过拨打Thrifty的1-800-THRIFTY预订电话号码,客户在应用OSR语音识别技术获得高效服务的同时,也获得最优惠的汽车租用费率。

捷通华声公司供稿 CTI论坛编辑



相关链接:
捷通华声发布jASR5.5 ASR价格面前将无怯步 2008-04-16
捷通华声TTS成功登陆中国邮政储蓄银行 2008-04-03
捷通华声 jTTS 5.5 全面支持 MRCPv2标准 2008-03-31
捷通华声移动导航HCI解决方案广受青睐 2008-03-26
身边的“智能”生活 2007-12-28

分类信息:  语音合成TTS_与_语音识别ASR     新闻频道   技术_语音应用_新闻   技术_语音应用_新闻