首页>>厂商>>IVR系统平台厂商>>Voxeo

VoiceXML论坛官方认证平台

2008/12/10

VoiceXML背景简介

  自从Web诞生以来,Web的每一步发展、技术成熟和应用领域的拓展,都离不开W3C(World Wide Web Consortium,W3C理事会或万维网联盟)[1]的努力。W3C于1994年10月在麻省理工学院计算机科学实验室成立,创建者是万维网的发明者Tim Berners-Lee。W3C组织是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来制定。W3C会员(大约500名)包括生产技术产品及服务的厂商、内容供应商、团体用户、研究实验室、标准制定机构和政府部门,一起协同工作,致力在万维网发展方向上达成共识。W3C是专门致力于创建Web相关技术标准并促进Web向更深、更广发展的国际组织。

  创建伊始,W3C就开始以引领Web技术的发展和促进为己任。其宗旨概括为7点:推进Web的普及、解决语义网络(Semantic Web)问题、Web应该是可信任的网络、协同工作、可持续发展问题、权利的分散问题和支持多媒体。总之,W3C以开发“Web事实标准”的各种技术规范作为其核心任务,目前已开发了超过50个技术规范。这些技术规范中大部分是由各个功能组开发的各种功能性规范,同时也包括WWW的核心体系结构。W3C的这些成果基本上已由企业和研究机构进行了实现。

  W3C的已有工作成果和工作框架如图1所示,该图展示了万维网的基础框架及W3C的工作重点。W3C技术架构图描绘了一个两层的模型:万维网体系结构(被标注为“One Web”)建立在互联网(Internet)体系结构之上。图中丰富的Web层显示了W3C关心的领域和发展的技术。在顶层包含着六个框,分别与W3C主要的活动组相对应:Web Applications、Mobile、Voice、Web Services、Semantic Web和Privacy Security。其中的“Voice”框中所罗列的VoiceXML、SRGS、SSML、CCXML和EMMA则标示着语音领域的重要工作。

  W3C正致力把万维网从最初的设计(基本的HTML、URIs和HTTP)转变为未来所需的模式。W3C的技术将帮助未来万维网成为信息世界中有高稳定性、可提升和强适应性的基础框架。

  VoiceXML[2]最初由VoiceXML论坛[3]创建,现由W3C主持,是W3C开发的基于XML的语言,用来创建为电话应用刻画合成语音、数字音频、话音与DTMF键入识别和音频录制的语音会话。其宗旨在于为用户定义一种新方法,运用基于Web的服务通过口头指令和DTMF键盘实现交流,通过事先记录的话音、合成话音或音乐流获取信息。为了迎接这种挑战,W3C定义了一套在设计上与网页编写标准相类似的标记语言,以规范应用程序的语音问题,例如用户对话流、自动语音识别与相关语法、语音合成与呼叫控制等。它将传统的专用与密闭式IVR系统提升成开放式可编程体系结构,并且通过提供类似于HTML表单或CGI脚本的可编程会话把Web技术的优点延伸到电话用户。

为什么要用VoiceXML?

  VoiceXML的推出给电话语音系统带来全新的应用和开发概念,使传统的CTI技术从繁琐、封闭的模式中走了出来,使广大的语音系统开发人员可以用极其简单的方法实现复杂系统的开发。

  完全替代传统CTI:传统的电话语音系统典型的工作方式是接受用户的按键输入和语音文件播放、跟据用户的需求为用户提供相应服务。基于VoiceXML开发的电话语音系统完全可以替代传统CTI系统所能提供的功能。

  语音识别功能:基于VoiceXML开发的电话语音系统除了接受用户的按键输入之外,还可以接受用户的语音输入。系统通过语音识别功能实现对用户输入语音到文本的转换。这对于许多仅用按键输入方式而无法解决或解决起来很繁琐的应用领域很有实用意义。

  语音合成功能:基于VoiceXML开发的电话语音系统除了能够播放预先录制的语音文件之外,还可以将系统中的文本转换成语音的方式播放给用户。这对于那些需要播报即时消息和可变信息等的应用领域很有实用价值。

  与互联网联结:长期以来,公用电话网和互联网是分离的。随着互联网技术的迅速发展,互联网信息与日俱增,以及互联网相关服务的日新月异,将互联网与公用电话网整合为一体,使广大的电话用户也能享受到互联网提供的信息和服务显得越来越有吸引力。VoiceXML使公用电话网与互联网有机地结合,使两网的信息能够相互流动。例如,电话语音留言可以通过互联网以电子邮件的方式传送到目的地;互联网上的新闻可以通过电话播放给用户等。

  灵活的数据库接口:许多电话语音应用系统离不开数据库访问。VoiceXM通过脚本方式提供灵活的数据库接口,使得应用系统可以方便地访问各种数据库,如:Microsoft SQL Server、Oracle、Sybase、Microsoft Access、MySQL等。

  简化开发过程:用VoiceXML将电话语音应用系统开发人员从繁琐的编码细节中解脱了出来。开发人员不需要了解相关软件(如语音识别和语音合成)和硬件(如语音卡)API的编程接口,只需要把精力放在应用领域的业务流程上。开发过程轻松快捷、开发周期大大缩短(7-10倍)。VoiceXML使开发人员得以用简单的方法实现复杂的工作。

  除此之外,基于VoiceXML开发的语音应用系统具有很高的系统可扩展性、可维护性、可移植性、可重用性和开放性。

图1. W3C技术架构图

VoiceXML论坛认证计划

  VoiceXML论坛已经开展了对VoiceXML应用开发人员和平台认证计划,前者主要是检验VoiceXML的开发技能,而后者则是就厂商所实现的VoiceXML平台对W3C VoiceXML 2.0规范的遵从进行认证,包括以下内容:

  该认证计划由VoiceXML论坛会员管理和开发,通过独立的第三方测试实验室保证其认证过程与结果的公正性。CT Labs [4]被选中作为首家独立测试实验室来进行一致性测试。

  VoiceXML平台认证计划[5]由测试套件、测试控制和独立测试项目组成,目的是认证所实现的平台能通过VoiceXML测试套件所需的所有测试。该测试套件基于W3C VoiceXML 2.0规范[6]和W3C VoiceXML 2.0执行报告测试套件[7]。

  测试项目的主要目的是通过提供一种测试一致性和互操作性的程序,来促使并认可厂商和用户充分利用VoiceXML论坛所创建的有价值的标准。带有“通过VoiceXML认证”(VoiceXML Certified)字样的应用是指的满足一致性需求,并且通过VoiceXML认证计划对其兼容性进行了认证的应用。整个认证计划拥有一套严格而细致的流程,如图2所示。


图2. VoiceXML平台认证过程

具体的认证政策和认证过程请参阅VoiceXML论坛提供的官方资料:

VoiceXML论坛官方认证平台

  下面列出已经通过了针对VoiceXML 2.0规范和VoiceXML Forum Test Suite v1.0测试套件的VoiceXML论坛平台认证计划的一些代表厂商,如表1所示。完整的列表请参阅VoiceXML论坛网站:http://www.voicexml.org/platform_certification/certified_platforms.html

表1. 通过VoiceXML平台认证计划的代表厂商(按字母顺序排列)

  [1]Voxeo公司是一个致力于IVR领域的产品开发商和服务提供商,自1999年成立以来,一直是VoiceXML标准核心制定者之一,同时还是CCXML标准制定的主席。

  [2]Prophecy是业界第一个(也是目前唯一的)100%通过VoiceXML 2.1标准全部官方测试的应用平台,同时率先100%实现了CCXML规范。它不但自嵌TTS和ASR,同时支持标准的MRCP接口,可以和第三方语音引擎集成。

  [3]VoiceCenter(Evolution) 是一个免费的面向开发人员的互联网社区门户。通过基于Web页面的图形化的IVR应用设计和开发环境,提供类似工作流的开发方式,使得开发人员即使不了解VoiceXML和CCXML规范也能开发出高质量的IVR应用系统。Voxeo为开发人员提供免费的全天候的技术支持。

参考资料:
  [1]W3C: http://www.w3.org/
  [2]VoiceXML规范: http://www.w3c.org/voice/
  [3]VoiceXML论坛: http://www.voicexml.org/
  [4]CT Labs: http://www.ct-labs.com/
  [5]VoiceXML平台认证计划: http://www.voicexml.org/platform_certification/index.html
  [6]VoiceXML 2.0规范: http://www.w3.org/TR/voicexml20
  [7]VoiceXML 2.0执行报告测试套件: http://www.w3.org/Voice/2004/vxml-ir/

CTI论坛编辑



相关链接:
Voxeo VoiceObjects 统一自服务提高满意度 2009-09-23
Voxeo携Prophecy10高度亮相SpeechTEK2009 2009-09-03
拥有中文TTS的Prophecy IVR语音平台 2009-08-17
Voxeo发布开源的电话“云计算”服务平台 2009-08-12
自助式语音平台开发利器Prophecy Platform 2009-08-03

分类信息:  CTI平台技术_与_交互语音技术  CTI平台技术_与_voicexml技术  交互语音技术_与_voicexml技术