首页>>厂商>>系统集成及应用软件开发商>>广州新太科技公司

国内IVR应用语音识别还不多

彭凌哲 2000/12/07

  目前的语音识别系统分为两种:一种是面向计算机个人用户的,一般安装在用户的个人计算机上;另一种是面向CTI领域的,主要是使CTI应用系统能够实现语音识别功能。


  ■CTI对语音识别提高要求


  应用于CTI领域的语音识别技术有别于一般PC机系统所使用的语音识别技术,其面临的困难体现为:电话录音质量差,识别率要求高,系统不能对电话用户进行训练;另外,系统还要能够完成大量用户语音数据的并发识别请求,这就对应用于CTI领域的语音识别技术在功能和性能上要有更高要求。

  由于存在上面列举的种种困难,使得应用于CTI领域的ASR技术不可能像应用于PC机的ASR技术一样,能够随心所欲地识别用户所说的任何词汇。因此,目前应用于CTI领域的ASR技术是一种基于词汇和语法的识别技术。对于一个CTI应用系统,需要根据系统需求设计一种语法,语法必须包括与用户交互时用户所有可能的语音输入,而词汇就来自于语法中所有可能出现的单词。不同的ASR厂商还会加入一些增强性的功能,如barge-in打断功能、自然语言理解等等。


  ■语音识别拓展CTI应用


  ASR技术给CTI领域带来了更加广阔的前景。以往用户使用电话接入时,与系统进行交互就只能通过电话按键或人工服务进行交互,对于复杂的系统,如邮政编码查询、天气预报、航班查询等,如果使用按键表示的话,用户根本无法记住这些表示,而只能通过人工服务进行查询。像传统的168信息服务,由于只能使用按键进行服务,用户又无法记住如此之多的号码及功能选项数字,大大降低了使用168信息服务的用户。而使用人工服务,又增加了系统运营商的运营成本。

  ASR技术的出现必将改变这一情况。通过语音识别技术,CTI系统可以实现让用户使用语音与系统进行自动交互,如用户要查询城市天气情况,只需说出城市名称;要查询航班情况,只需说出目的地城市;要查询股票价格,只需说出该股票的名称。再结合TTS(Text To Speech文本转语音)技术,CTI系统可以提供非常强大的电话自动交互系统。

  目前ASR技术与CTI的结合在国外已有大量实际应用的实例,国外许多大公司,其电话总机系统大都采用了ASR技术。外线接入时,无需拨打分机号码,只需要说出要找的人的姓名或办公室名称即可。更大规模的应用如企业黄页查询、客户服务中心,ASR技术已得到越来越多实践。


  ■IVR用语音识别还不多


  目前主要的ASR厂商,国外的主要有飞利浦、Nuance、IBM等,国内的有香港特区的InfoTalk等。各个厂商都提供了多个层次的开发包及相关开发工具,实现的功能及效果也大致相近,但在细节上也存在许多差异。相比之下,Nuance公司的产品显得功能更齐全,性能更优;而InfoTalk的产品则中文本土化的程度更高,在中文识别上丝毫不逊色。

  新太科技一直密切关注ASR技术的发展,早在1999年10月,新太科技就与飞利浦公司在语音识别技术上签定了合作协议。在今年又先后与Nuance和InfoTalk公司达成了合作意向。新太科技使用当今世界最先进的ASR/TTS技术,已开发出了一系列全新的应用系统,并将在未来结合语音互联网进行全面的应用推广。

《赛迪市场专家》 2000/12/07


分类信息:  交互语音_与_语音识别ASR     技术_交互语音_文摘   技术_语音识别_文摘