Voice Web语音网

2001/12/30

  只需一个电话,用户和企业就可以与自己感兴趣的人进行交流、获取自己想要的服务和信息……

语音网简介

  网络俯拾即是,电话无处不在。如果把两种网络结合起来,就形成了另外一种大型网络:语音网。到底什么是语音网?它其实是一种内联网,通过它,用户可从任何一个具有语音功能的电话机上获取基于互联网的信息、开展电子商务以及获得个人通信服务。使用语音网,不但可以拨打电话,还可以在一次连续的通话过程中获取互联网上的有关内容。

  目前,在信息的收集和从事商务活动过程中,言语交流仍然是最常用、最有效的途径之一。随着计算机处理及语音算法的飞速发展,基于电话的语音识别系统现在已经能够理解正常的语言交流。90年代中期以来,许多位居前列的蓝筹股上市公司开始使用V-Commerce ? ,即语音商务(语音驱动的电子商务),通过对语音的确认来提供诸如航班信息和实时股票交易方面的服务。正当个人IT应用程序让位于互联网之时,这些特殊的语音驱动应用程序却正演化成一种叫做“语音网”的新型网络。

  那么,到底语音网是怎样的一种系统呢?设想一下,你只需待在家里,拿起电话,通过语音来浏览最新的高科技人才需求情况、欣赏和订购最新的CD、或者通过记录在电子通讯簿中的姓名来与客户取得联系。

  语音网正处在发展过程中。越来越多的公司正以互联网发展的速度将服务(统一讯息服务、长途电话服务、网上购物等)和基于互联网的内容(股票行情、电影、黄页等)搜集起来,并通过任何一部电话使这些服务和内容成为可能。企业和电子商务公司有大量的机会,将其客户延伸到大量的全球电话用户,这些公司和企业正协助结构提供商,通过语音使内容和服务变为可能。技术和产品标准化将加快语音网服务的发展,正如产业标准化使万维网(World Wide Web)飞速发展一样。

  本报告旨在介绍语音网的基本知识,并简要列出了公司和用户希望获得服务的种类。在阅读了本报告后,企业、电信服务提供商、互联网和结构公司就会了解如何适应语音网生态系统的发展。

市场推动了对语音网的需求

  众多的市场推动力结合在一起,推动了内容和服务的直观语音接口的发展,使得用户可在任何时间、任何地点使用这些服务。

  电话尤其是移动电话无孔不入

  如今,全球只有2亿台能够上互联网的个人计算机1,与之相比,全球的有线电话用户却达到8.5亿,无线手机用户也已达到4.5亿。随着移动通信服务越来越广泛,预计到2003年无线手机用户将发展到10亿2。这无疑将使电话成为最普遍的网络接入设备。由于从现有的电话上可以连接到语音识别服务器,因此电话是向广大市场提供服务的最佳设备。

  万维网呈爆炸式增长

  在不到5年的时间里,互联网在世界范围内掀起了一场轰轰烈烈的信息交流媒体的革命。今天,超过2.6亿的人们将互联网视为其日常生活中不可或缺的一部分这也主要归功于它具有方便性、娱乐性,以及能提高工作效率等诸多缘故3。

  通过互联网,用户可以一步到位地获取实用的任何类型的信息,这就是互联网之魅力所在。但是在从网上获取信息时,要求用户必须坐在桌前,这使得其在移动化程度较高的社会中的发展受到了制约。消费者对互联网情有独衷,从而促使设备生产商提供机动性服务,这些机动性服务就是通过个人数字助理(PDA)和智能电话连接到互联网网络上。Palm? 掌上设备和无线应用协议(WAP)手机是较为常用的移动设备。

  这些设备让越来越多的人们意识到:通过移动设备获取互联网上的内容是可能的。尽管文字信息较为有用,但是较低的传输速度和屏幕较小,交流困难,降低了这些设备的使用价值。

  电话用户的增多以及可以随时随地获取互联网信息的吸引,刺激了市场对简单、个性化服务的需求,即个人和公司可以快速、方便地与他人交流、并得到自己想要的信息。仿佛一夜之间,语音网将电话转换为世界上最方便的,可以进行语音及数据检索的通信工具。

语音识别技术

  尽管电话的发明已经超过了120年,但是语音识别系统用于商业上还只是近年来的事情。实际上,基于电话的语音识别软件容纳了丰富的词汇,可以不需要对用户进行培训,还可以支持任何类型的电话,甚至支持那些直到90年代中期才出现的电话。现行的语音系统支持口语中的常用短语,如“我想在股市上买33股3Com。”

  人们喜欢使用自己的语音,而不想按动键盘,也不想直接对人说话。1999年,Evans Group Research对从使用各种语音系统的250个用户那里搜集的反馈信息进行了分析4。定量结果表明:对语音系统和按键式系统,83%的用户更倾向于前者,而对于语音驱动系统和与中间人进行通话,74%的用户倾向于前者。

  语音识别由某一网络服务器而不是电话本身进行处理。这种配置使系统充满生机,同时还可以升级,以支持数百万的用户,而且还能识别用户对同一信息所提要求可能使用的所有途径。用户还可以在已经获得想要的信息时进行打断(中断系统提示)。

  对于任何一种新的服务来说,如果想成为一种主流,使用灵活、方便是必备的两个条件。许多公司都在建设语音驱动服务,因为对于任何年龄、任何生活方式的人们,语音识别都不失为一种直观的方法,使他们可以从任何一部电话上获取想要的信息,并与感兴趣的人们交流。

语音网的目标

  语音网的目标就是要将个人和公司在日常生活中常用的两种网络结合在一起即互联网和电话网络。这种新型的、相互交织的语音驱动网络可以提供大量的基于互联网的内容、商务和个人通信服务,操作方便,只需一个电话和一个有用的语音浏览器就可以。在不久的将来,服务提供商将使用户在电话接通的状态下,连接到语音网中,古老的拨号方式将被淘汰,而代之以一个友好的问题,如“怎样才能帮到你?”。

  青少年和公司的高层管理人员可以通过语音网,获取最新的关于其公司日常运营数据的详细情况。当然,并不是每一个网页都适合或者可以通过电话访问的。语音网所发送的是本地化的、个性化的基于互联网的信息和服务,并且是与移动用户和公司相关的。语音网应用程序将由用户通过一个标准的语音浏览器来进行定义和控制,使用这种浏览器,用户可以在站点上自由驰骋,方便地获取信息。

语音网上的节点

  在语音网上,内容和服务将会以两种方式出现即个人语音站点和语音入口。语音入口和语音站点都属于网络上的节点,这两者由一个标准的语音浏览器连接起来,关于这部分内容,将在以后进行描述。

  语音入口 是将服务(如统一讯息、长途电话、购物等服务)和基于互联网的内容(股市行情、电影、黄页等)搜集起来。通过拨打一个免费的号码和一个专用的基于网络的连接代码,呼叫者可以进入连接到语音入口服务上。

  语音站点 是语音网上的节点,它包括可以使用语音服务的企业或电子商务应用程序以及语音商务服务。

语音入口提供商

  语音入口是应用程序服务在语音网上出现的第一种类型。快速移动入口提供商设定了初始用户的服务内容,并打开了为其它公司开展业务、并销售特殊产业或特殊功能的服务的大门(诸如购物)。

  有不少公司都注重将语音入口服务推向市场。其中包括早先的领导者:BeVocal和Tellme。

  “第一个吃螃蟹”的公司仅仅注重提供语音入口服务,语音网使这些公司有机会通过电话经营互联网商务模型。

  对于服务提供商,语音入口服务使他们有机会增加网络的用途,提高用户的忠诚度,占有更多的市场份额,并使现有的服务各具特色。

  一开始,语音入口服务在很大程度上是横向的即提供智能化、协同的信息服务和商务应用程序,其核心是为了娱乐和方便起见。入口提供商将这些内容和服务打包,旨在推广成功的商业模型,将有用的信息与安全交易连接在一起。

  这些早期的语音入口服务瞄准繁忙的移动通信行业。例如,某些内容采取某些服务的形式,使日常工作需求与个人生活达到平衡,而另一些提供的内容则是为了使用户在度过繁忙的一天后,在家中就可以进行消遣。

  以下是语音入口服务可以帮助一般的商务人员的时间及地点。

  在车上进行工作联系时……

  到另一城市出差或旅游时……

  随时可以……

  语音网最吸引人之处就在于它可以在一次通话中,同时处理多个任务。下图表明一名商务人员是如何安排好与一个未来的商务旅行有关的一系列任务的。他获取了对自己有用的信息,顺利达成了一项语音商务交易,接收个人信息和办公室的帮助,并拨打电话所有这些都是在一个同步过程中完成的。

(此图可点击放大)

语音网上的语音站点

  语音网的很多初始内容将由语音入口服务功能来提供,而不像 90年代早期的CompuServe和AOL服务那样。但是一旦语音网发展成熟,更多的内容将来自于电子商务和企业语音站点。

  很多企业正在削减伴随着代理服务呼叫中心和电子商务运作而产生的成本5。大多数航空公司和财务机构领先于其它企业,它们使用语音识别系统来提高客户的满意度,同时还节约了大量的成本。

  随着语音商务交易数目的增多,电子商务公司的客户基地和销售收入也将增加,因为语音网把电话变成了快速的销售设备,使得购物实现了个性化和本地化。预计到2005年,来自语音商务方面的收入将超过300亿美元。6

  这些语音商务解决方案将演变成语音网上的节点,可以直接或者间接地从相连的语音入口服务上进行访问。而后面的一种连接方法将对电子商务公司和企业如何管理客户相互之间的作用产生影响。通过在供货商和入口提供商之间建立联系,企业和电子商务公司允许入口提供商连接到企业的语音站点上,它所采用的方式与现在从网络接口上网一样。所不同的是,它网络浏览器进行连接,而是用语音浏览器让用户从一个站点访问另一个站点。除了收入增加的刺激之外,促使企业和电子商务公司加入语音网的部分原因是它将电话基础设施方面的负担和成本转嫁给了入口提供商。企业或电子商务公司就与接口提供尚建立商业关系,处理语音商务交易来作为回报,并代表他们查询或连接到他们的站点上。

  在同样一种方式下,竞争也刺激了需求,因为每一家公司都可以出现在网络上,语音网提供了一种从网上获取内容和服务的便捷方式,因此语音站点数目的增加推动对这种方式的需求。

语音站点价值链

  众多企业联合在一起,致力于将语音网的服务推介给顾客和商务人员。有效的合作关系是在语音网上制胜的关键,因为没有任何一家公司可以在互联网上提供人们和公司想要的所有东西。

  许多语音入口提供商向个人和公司提供语音网上的服务,而内容和结构公司则向这些入口提供商提供技术支持、产品和主机服务。

  语音网价值链由以下几类产业公司组成:

  语音入口提供商某些类别的公司向个人和企业提供或计划销售语音入口服务:

  网络入口希望将其网上业务扩展到每一部电话上,并通过更紧密的结合关系来扩大其收入的、占领先地位的互联网入口。

  网络服务提供商希望通过网上提供的、或从第三方供货商那里获得的特定服务,来提高客户忠诚度和网络的用途的电信或互联网服务提供商。

  启动语音入口基本业务是建设、提供并销售针对特殊听众的语音入口服务的公司。这些服务可以按照带有机密标记的协议由网络服务提供商进行分配

  汽车汽车生产商愿意向互联网驱动程序提供通信接口(其功能如同汽车上的车轮一样),以便从使用和语音商务服务中获取新的收入。

  内容公司-对依靠低成本来扩大服务内容感兴趣的企业、电子商务和信息服务公司。这些公司都可以通过语音服务,将自己的信息在语音站点上成为可能,或者搜集/联合各种内容销售给语音入口提供商。

  结构公司-技术软件提供商(语音识别、位置标识)、主机公司和服务站、网络发展商(网络应用程序服务器、网络整合工具)、软件和平台提供商和趸售网络传输提供商。这些公司将与语音入口提供商建立公司对公司的关系。

语音网上无限商机

  语音网为所有入网的公司提供了巨大的经济发展潜力。本部分重点介绍正在形成的商业关系和收益方面的机会。

  公司对公司的机会企业和电子商务公司将使用语音网,用较低的成本来扩大其客户基地,并实现收入的增长。语音网展示了一种通过入口提供商来销售产品和服务的机会,在这种机会下,可以不需要耗资巨大的广告战和费用昂贵的呼叫中心,只需通过电话就可以处理交易。向入口提供商支付的费用不等,可以仅仅是先期介绍费,也可以是总成交金额的一定比例。入口提供商可以与结构和内容公司建立供货关系,购买Voice Web Ready?7内容和服务,提供技术和产品,提供主机服务、专业服务和趸售网络交通。应用服务提供商将在语音站点和语音入口服务上提供寄宿服务,同时还向依靠Voice Web Ready?从事零售业务的商人们销售产品系列。起始入口提供商收入的大部分从语音商务交易中获得,也有从广告、赞助以及与网络服务提供商签订的第三方分配合同中获得。

  公司对顾客的机会:语音入口提供商将直接向公众进行销售活动,并管理由于服务而产生的与个人和公司的客户关系。为了推动病毒软件的发展,某些入口提供商将提供免费的初始服务,因此他们的大部分收入来自语音商务交易、网络使用和广告。

  Ovum是一家位于领先地位的英国咨询公司。据该公司估计,到2005年,全球的语音入口服务市场将达260亿美元8。在美国,语音和移动通信业的分析家估计,到2005年,语音入口服务和技术市场将超过120亿美元9。

  下表概括地列出了语音网在公司对公司(B2B)和公司对客户(B2C)关系中的收益。

 

技术使语音网成为可能

  HTML和Netscape? Navigator由于使开发商公布内容更加方便(通过一个便于使用的地理网络浏览器,广大听众可以得到这些内容),从而加速了万维网的发展。结果就是目前已经有超过950万网站得到了公布。10

  很多公司寻求在语音网上提供相似的领先关系,提供标准技术和产品,以加速内联语音网的建设。下文重点介绍了其中的一些技术和使能产品。

  语音识别一种内容丰富的、可以升级的软件服务器引擎,可以听懂人们说的话,并在理解的基础上执行一些操作。

  声纹鉴别使用个人生物统计声纹,安全地连接到语音网上,不论是登记时的确认还是交易的确认。由于有了声纹鉴别和安全储存/利用个人购物信息的能力,使得忙碌的顾客在比较商品、购买或尝试新的促销方式时更加方便。

  语音浏览器由所有的行业参与者使用的标准用户接口,所有的应用程序应与这种接口相一致。有一种标准的语音浏览器,如Nuance Voyager? ,使网上驰骋、文本管理和交易达成能够通过语音网的某些标准设施成为可能,这些设施包括书签、文件夹、用户鉴别等。它配置在入口提供商而不是电话上。

  文本到语言(TTS)-将机器可读的文本信息转化为可以听到的合成语音的一种技术。TTS用在目录较多、信息频繁转换或当录制音频回放成本较高(不可行)时。

  音频可以提供信息输出,帮助语音网入口服务创建特定人员的音频内容(现场卫星广播节目、流音频、联合广播、录制的声音等)

  VoiceXML—— 一种用于创建语音应用程序的升级语言的新标准。

  SpeechObjects——SpeechObjects是一种基于开放式标准的、可以重复使用的语言应用程序组件,它可以单独使用,也可以与VoiceXML一起使用,从而丰富了语音网的应用程序。

  开发商工具大量的工具将加快语音站点和语音网应用程序的发展。Nuance V-Builder? 就是这样一种工具,它使用VoiceXML和 SpeechObjects,在快速发展和语音站点的配置上起辅助作用。

  位置标识决定地理位置、旅行方向、移动电话传输速度的技术。位置标识将增加语音网应用范围,如行车方向、语音商务和地方新闻和交通信息。

语音网的发展

  尽管语音网尚处在一个初级阶段,但是它却具备了爆炸式发展的基本要素。语音入口提供商正与已经建立了的结构和内容的公司联手起来,提供多种信息和服务。今天,某些语音站点正在部署之中,以支持客户获取企业的服务,几乎每天都有新的语音入口出现。商业模型正吸引大量的风险资本,而基于标准的技术和产品为内联语音网奠定了基础。

  最终,语音网将演变为提供“智能拨号”或通话访问语音网(只需在家里,拿起电话的手机或打开移动电话就可以获得服务)的网络服务提供商。在这个转折点上,电话网络和万维网将完全结合起来,这样客户可以在任何地点24小时不间断地与他人进行交流,并收集自己感兴趣的信息。

  语音网上蕴涵着无限商机。那些已经涉足到将两个最强大的网络(即电话网络和互联网)的合并工作中的公司无疑将从中获得极大的受益。

Nuance公司简介

  Nuance公司是自然语音接口软件的佼佼者。使用自然语音接口软件,人们可以通过电话方便安全地获取信息、服务并进行交易。每天,千千万万的人通过拨打运行Nuance公司语音识别、语言理解和声纹鉴别软件的电话,进行出游预订、股票交易、与其它通讯媒体、企业和互联网系统进行交往等活动。美国航空、Bell Atlantic、Charles Schwab、家庭购物网络、Lloyds TSB、Sears、UPS等大公司使用Nuance的软件来为客户提供更好的服务,同时也大幅度降低了成本。Nuance是语音商务联盟的发起成员,并领导创建了语音应用系统开发的开放标准。Nuance公司的总部设在加州硅谷的Menlo Park,世界各地均有分部和合作伙伴,提供多语种支持的解决方案。来体验Nuance公司最新的技术吧,请打电话1-888-NUANCE-8或浏览公司的网址www.nuance.com。

NDN - Nuance开发商网络

  Nuance Developer Network (NDN - Nuance开发商网络) 是语音识别行业第一个开发商网络,它向成员提供最新的产品发布信息、培训、在线技术论坛,以及和其它开发商进行想法和方案共享的机会。通过www.nuance.com or extranet.nuance.com 网址,可以下载最新的Nuance产品和工具。

Nuance公司供稿 CTI论坛编辑



相关链接:
Nuance发布Vocalizer 5.0文本语音转换方案 2009-09-04
化繁为简,让手机“一切行动听指挥” 2009-08-13
Nuance语音识别技术助力医学中心节省开支 2009-08-12
Nuance携手IBM提供先进的语音识别解决方案 2009-08-05
Nuance语音识别技术将进军中国 2009-06-17