首页>>>技术>>>语音应用>>>语音识别(ASR)  语音识别产品

 

最新上网用语音

王建锋 2000/11/16

  你会开口讲话吗?你周围有电话吗(固定的、移动的、车载的都行)?如果你对这两个问题的回答都是"YES"的话,那么你立即就可以上网了。收发电子邮件、实时了解国内外大事、同步股票行情、个人通讯录查询等等,你只要说一声就行了。这种简单的上网方式,据说是继PC、WAP手机上网之后的第三次上网浪潮。人们不再面对电脑,也不用担心WAP手机上网显示屏太小、费用太高了。


  ■运营商的新服务


  语音上网是传统电话与互联网相结合的产物,它应用语音识别技术,只要用户按下电话号码,系统就可识别相关的命令,从而给用户提供网站上的信息,包括股票行情、交通状况与流量、天气情况、电影、餐厅订票等服务。它通过在PSTN与互联网之间放置中文语音网网关,来实现语音识别和语音合成等,最终对用户实现语音上网。以“说话”来控制的电话自动信息系统,是银行、电信、证券、运输等行业提高服务质量、增强竞争能力、节省时间的有力武器。

  为了把电话上网增值服务做得更好,中国电信、中国移动在今年6月底先在北京建成了语音上网业务试验节点,经过4个月的试验,系统稳定,基本上能满足注册用户以普通电话、手机、车载电话等终端随时随地通过语音方式收发电子邮件、查询新闻、天气、商务、娱乐等互联网信息。今后电话上网业务将陆续在其它省市展开。中国联通目前也在积极考虑开通此项目。

  至于这种方式的用户群以及应用前景,中国电信的有关负责人表示,语音上网虽不能完全取代PC上网,但语音上网可以丰富人们获取信息的方式,使人们获取信息更加方便和自由,并且价格低廉。目前只收取电话费,今后电话费将减半,网费可能1天只收一元钱。按中国目前的状况来看,由于Internet的普及程度较低,而固话通信与无线通信发展却非常快,用语音作为界面来获取信息将一定能够有自己的市场存在。


  ■语音门户浮出水面


  伴随着语音上网概念的出现,作为提供信息服务的语音门户也浮出水面。在目前国内的一些语音上网应用中,如科大讯飞与上海热线合作,用户新邮件到时,可主动通知用户的呼机或手机。新太与掌门网合作,针对移动手机用户主要提供语音电子邮件,用户可以通过电话来收发电子邮件。亚洲语音与雅虎合作提供的语音上网服务,北京的用户可以在注册后通过拨号享受语音邮件、个人信息定制、股票行情、生活速递、旅游热线等服务。

  语音门户应该说是一个很有吸引力的市场,一些新成立的公司跃跃欲试,而一些老牌的ICP为了保持自己的传统优势,自然也不会将这块肥肉让给他人,他们可以在做传统文字网站的同时,开设语音门户来吸引更多的人用电话上网,促进电子商务的发展。在国外,这项新领域已经引来了许多有实力的参与者,如Tellme、BeVocal、 Quack、AudioPoint等等。他们推测,如果国际互联网中有巨大商机的话,他们将会依赖支持语音功能的网站获得巨大利益,因为每个人都将有一部电话。美国AOL与雅虎也早已投身其中。

  目前,国内也已有ICP开始瞄准语音门户,像新浪网、像北京郊区电信局下属的畅捷网苑都非常看好电话上网。语音门户会不会幸运一点,可以赚到钱呢?这还是个未知数,但业内人士依然将目光放在了广告身上。也许会由于电话的沟通方式不同,语音门户在创收方面会有所作为。如今,电信增值业务已对外资开放,相信用不了多久,一场国际语音门户战将打响,究竟谁胜谁负,我们还将拭目以待。


  ■语音识别欠完善


  目前,这些语音门户站点所使用的语音识别技术虽然有了很大的发展,但要想达到完美还有很长的路要走。当前语音合成技术的发展还需提高合成语音的自然度;丰富合成语音的表现力,通过对相关参数的调整来实现对年龄、性别特征的改变,进一步实现语气、语调的变化,提高多语种文语合成的精度。现在语音识别的准确度大约在90%,也就是说在每句话中一般都会出现一个错误。如果是在语音输入中十中对九是相当可观的,但是这样会造成电话一端的用户对此失去信心。对于“抱歉,我还是无法理解您所说的。”这句话到底用户能忍耐多久,的确值得担心。

  目前,Intel已经开始投资发展语音识别技术,Intel在中国建立的研究中心的一个重要项目就是语音识别。来自言丰科技所开发的Voice Touch交谈式语音识别电话系统已经可以识别英语、普通话和广东话三种语言,而同时国外公司如IBM、L&H,国内公司如捷通等也都在开展相关的研究。


  ■语音上网终将实用


  谈到语音门户的发展前景,一位业内人士指出,语音门户仍是很新的应用,目前的语音识别技术还未成熟,真正有效的语音识别技术二三年后才会发展起来。而且语音识别的过程非常复杂,1台800M容量的计算机才能完成1个语音的识别,同时还要考虑不同说话者的不同口音。基于电话品质及线路的原因,一般电话上的语音都有不同程度的变化,语音识别系统能够容纳多大差异的语音,是语音识别中的关键。

  另一方面,即使语音门户站点通过各种方式向用户灌输可以摆脱电脑更快速地查到信息的方法,但让消费者真正通过语音上网,仍然像天方夜谭。普通人的短期记忆能力给语音上网方式带来了相当大的困难。很少有人能够长期记住菜单操作的每一步,而语音导航系统往往是一个缓慢且缺乏指引的处理过程。

  电话作为网上购物和冲浪的工具可能是不合适的,这也是各种语音站点把自己定位为传统互联网站点和门户的ASP的真正原因。雅虎的一位负责人说:“语音门户真正的利润来自于ASP,而电子商务和广告收入是网站的另一主要经济来源。”因此,雅虎进入语音网络领域并非为了赚钱。这种门户可以让客户在其他设备上上网,客户群相对稳定。“每个业内人士都希望将他们网站的影响力拓展到台式机之外,但到目前为止还没有真正出现实用的语音上网解决方案。”

  不过一项新技术的成熟不可能是一蹴而就,它的发展需要在使用中进一步完善。虽然我们一直对网络的速度怨声载道,但我们的网络生活还是在一天一天地完善着。同样,计算机要真正能够像人一样地说话,与人类自由地进行交谈,还有大量的研究工作要去做。今天的文语转换系统只能机械地朗读文章,与生动活泼、感情丰富多彩的人类语言相比,差距还很大。但是毋庸置疑,语音技术确实已经走出实验室,步入了人们的生活。

 

《赛迪市场专家》 2000/11/16


分类信息:     技术_语音识别_文摘