首页>>>技术>>>语音应用>>>语音识别(ASR)  语音识别产品

 

语音上网掀起第三次上网浪潮

彭芳、李瀛寰



  你会说话吗?会说话就能上网。这种简单的语音上网方式, 据说是继PC、WAP手机上网之后的第三次上网浪潮。

  也许有一天,繁忙的人们可以离开PC、离开笔记本,只是随手拨通电话,就可以知道当天发生的国际大事,就可以了解同步的股票行情,还可以知道他乡的天气是否合适旅游……通过电话来上网,以“说话”来代替键盘输入,以“语音控制”来代替键盘控制,实现语音上网一直是人类的梦想。而今天,随着语音技术的发展,特别是语音识别技术的突破,语音上网已经离我们越来越近了。


  ■ 语音成为第三种上网方式


  在PC成为传统的上网方式后,手机或者其他手持终端上网正铺天盖地地吸引着人们的注意力,成为目前最热门的话题。在人们还来不及细细消化理解手机上网时,技术的发展又迫不及待地将语音上网推到人们面前。据了解,在美国语音上网已经成为继PC上网、WAP上网之后的第三次浪潮。

  在PC时代,人们需要掌握一些基本的电脑知识、并且具备相关的有线接口才可登录互联网;在WAP时代,通过随身携带的手机,人们可以随时随地接入互联网,在便利性方面大大提高;在语音上网时代,在提供便利性之外,更大的突破应该是将互联网的门槛降低到“零”。你会说话吗?会说话就能上网,你不再需要掌握一些基本的输入方式,你不再需要熟悉小小的键盘。张嘴说话,就是你给系统给互联网下达的指令。从PC到WAP到Voice,每一次浪潮都把互联网的门槛降低了一大截。

  语音上网是传统电话与互联网相结合的产物,它应用语音识别技术,只要用户按下电话号码,系统就可识别相关的命令,从而给用户提供网站上的信息,包括股票行情、交通状况与流量、天气情况、电影餐厅订票等服务。它通过在PSTN与互联网之间放置中文语音网网关,来实现语音识别和语音合成等,最终对用户实现语音上网。

  以“说话”来控制的电话自动信息系统是银行、电信、证券、运输等行业提高服务质量、增强竞争能力、节省时间的有力武器。语音识别技术在美国已有很长历史,但应用方面基本上是以英文为主,语音互联网在国外已经开始应用。近年来,随着CTI技术的发展,我国香港、台湾及内地等许多CTI领域里的开发商开始致力于中文的语音识别。随着中文语音识别技术发展,语音互联网的概念开始在亚洲逐步成形,并正在逐成为现实。在语音互联网中,用户可以通过电话实现计算机上网的功能。在亚洲,由于Internet的普及程度较低,而无线通信发展却非常快,用语音作为界面来获取信息将极具前途。

  语音互联网和目前我们所使用的文字互联网一样,也涉及网站、上网终端、线路等诸多内容。但不同的是,语音互联网的终端就是电话,线路就是我们天天用的电话网,这也是语音互联网概念一推出就激起千层浪的原因,实现起来似乎太容易了。


  ■ 语音门户浮出水面


  伴随着语音上网概念的出现,作为提供信息服务的语音门户也浮出水面。在目前国内的一些语音上网应用中,掌门网与新太合作,主要提供语音电子邮件,用户可以通过电话来收取并且接听自己的电子邮件,同时也可通过说话来发送电子邮件。而在另一个由亚洲语音提供的语音上网服务实验中,北京的用户可以在注册后通过拨号享受语音邮件、个人信息定制、股票行情、生活速递、旅游热线等服务。那如何来定位语音上网用户的信息服务呢?它与手机等手持终端上网的定位是否相差不大呢?

  亚洲在线的总裁廖杰远先生认为,在这两者之间还是有一些差别的。对于语音上网来说,信息服务更加强调与用户的息息相关性。基本上可以分为三类应用:首先,电子邮件是最重要的一项应用。这样,人们在外时,可以抛却无线信道的种种不足之处,仅仅通过PSTN网来进行收发电子邮件。其次,人们可通过语音上网来获取一些实用信息,如交通路况、股票行情等。最后,语音上网的第三大用途是获取个人信息,如地址簿、日程安排等。

  语音门户应该说也是一个很有吸引力的市场,一些新成立的公司跃跃欲试,而一些老牌的ICP为了保持自己的传统优势,自然也不会将这块肥肉让给他人,他们可以在做传统文字网站的同时,开设语音门户来吸引更多的人用电话上网,促进电子商务的发展。已有ICP开始瞄准语音门户,像北京郊区电信局下属的畅捷网苑就非常看好电话上网。那语音门户会不会比它的前辈们幸运一点,可以赚到钱呢?这还是个未知数,但业内人士依然将目光放在了广告身上。也许会由于电话这种沟通方式的不同,语音门户在创收方面会有所作为。


  ■ 语音上网难在语音识别


  在前不久召开的Dialogic亚太区高峰会议上,最引人注目的就是Dialogic 总裁Howard Bubb先生演示的语音门户。Bubb先生用电话拨通一个号码,讲出其用户名及密码后,就登录上了一个语音门户站。在这里,他查询了新闻、股市信息,并“阅读”了自己的电子邮件。由于有了计算机系统和电脑语音卡的帮助,文字形式的邮件就可以被转换为语音信息读给他听。最让人感兴趣的是,语音门户中的语音提示音已经不是简单的“按1”、“按2”了,而是交互式的对话形式的电脑提示音。

  谈到语音门户的发展前景,Bubb先生指出,语音门户仍是很新的应用,未来一两年才有更大的发展,原因在于目前的语音识别技术还未成熟,真正有效的语音识别技术二三年后才会发展起来。而且语音识别的过程非常复杂,1台800M容量的计算机才能完成1个语音的识别,同时还要考虑不同说话者的不同口音。基于电话品质及线路的原因,一般电话上的语音都有不同程度的变化,语音识别系统能够容纳多大差异的语音是语音识别中的关键。

  在拿到亚洲在线的上网卡后,记者兴冲冲地拨通了那个神往已久的电话号码,在听到经合成发出的提示音后,清清嗓子发出了自己的第一道命令,还好算顺利过关。然好景不长,在一个关键的“收取邮件”命令上卡壳了,无论怎么强调,系统似乎就是识别不出来。记者第一次的语音上网尝试只好收场。其实,语音识别正是目前语音上网存在的技术上的最大的困难。

  目前,Intel已经开始投资发展语音识别技术,Intel在中国建立的研究中心的一个重要项目就是语音识别。来自我国台湾地区的言丰科技所开发的Voice Touch交谈式语音识别电话系统已经可以识别英语、普通话和广东话三种语言,而同时国外公司如IBM、L&H,国内公司如捷通等也都在开展相关的研究。

  据掌门网北京办事处郄建军介绍,目前掌门网推出的语音平台离真正的识别语音还有一段距离。用户拨打其特服号码95003、95002之前,会被告知尽量采用简短的语句来“点击”,如“新闻”、“查邮件”、“读邮件”等等,这样语音系统才会识别出来。而目前用语音“写邮件”恐怕还有困难。


  ■ 语音控制挑战传统键盘输入


  虽然电话是消费者最习惯不过的沟通方式,但如果真的要用它来上网却似乎不是那么回事。尤其在技术还不是特别成熟的今天,要在大庭广众之下,对着电话话筒一遍又一遍地简单地重复几个“命令”,这对一般用户来说还真是一个很大的考验和挑战。

  Duack.com是一家专门提供交通报告给消费者的语音入门网站,就发现人们不怎么习惯用电话来查询交通信息。而相比之下,股票等金融信息则更容易吸引人们的注意力,因为后者是用户普遍关心的话题。在欧洲所作的一项调查结果表明,许多使用手机的用户习惯使用按键,而不喜爱用语音指令。据Jupiter市场调查公司的统计,按键的确比语音控制来得实用,其分析师Seamus McAteer说,“我不相信用户会坐着听取他们的电子邮件。”那如何来改变用户用键盘输入的习惯,的确是当前要考虑的问题。

  但也有人持有不同看法,他们认为语音上网更是作为计算机上网、手机上网方式的一种补充,而不是竞争关系。在用户没法使用手机或计算机时,就可以用电话来进行语音上网。

  语音互联网作为计算机上网的有效的补充手段,是一个新兴的领域,也是一个非常让人看好的领域。

摘自《中国计算机报》2000.07.06



相关链接:
双节流行3G视频新业务——化身(AVATAR) 2009-09-17
Ditech语音转换文本技术将打造新型移动服务 2009-09-14
科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07
英国科学家成功开发识别多种语言唇读技术 2009-09-07
Convergys定制式语音鉴权方案获市场领袖奖 2009-09-02

分类信息:  语音合成TTS_与_语音识别ASR     技术_语音合成_新闻   技术_语音识别_新闻