首页>>>技术>>>语音应用>>>语音合成(TTS)  语音合成产品

 

语音应用开财源

卢晓信、段云峰 2001/06/25

  语音技术,虽然在国外出现得很早,但在国内开始步入实用领域,还是最近的事情。这一方面是因为硬件处理能力的提高,另一方面也是因为汉语处理在技术上已经有所突破。国外有资料显示,语音技术在未来的几年里,将以31%的年增长率进行发展。

  语音技术主要是指基于语音进行处理的技术,主要包括:语音识别ASR、语音合成TTS等等。


  语音技术进入商用


  语音技术开辟了一个如此巨大的应用市场,那么目前的语音技术发展到何种程度了呢?

  技术成熟进入商用

  在技术方面,英语的语音技术比汉语的语音技术的商用程度更广,实用程度更好。国内在汉语的语音技术方面,语音合成技术比较成熟,已经达到了商用的标准。而在语音识别方面,虽然已经有一些产品开始投入商用,但还有很多的技术问题要解决。

  厂家众多

  由于语音技术不仅要涉及到软件算法,而且也要涉及到硬件的实现技术问题,因此,目前的语音技术厂家,也分为几类。

  有的是从传统的CTI语音板卡厂商的角度,在产品中增加语音处理功能,国内像深圳东进技术、飞环,国外NMS、Intel通信产品事业部的Dialogic板卡;有的完全是语音技术的科研机构,根据自己的研究成果,进行产品化,例如中国科技大学的讯飞公司、清华大学的人机交互与媒体集成研究所等。在语音识别方面,国外的IBM、飞利浦、Nuance等公司,均有相关的产品;国内的有香港的InfoTalk、捷通等。

  在语音合成方面,能够提供产品的公司就十分多了,有的产品是用软件来实现,有的专门设计了硬件芯片。


  促进网络的融合


  语音技术的发展,带动了网络的融合过程。目前,世界上的两大通信网络是电信网和计算机网,电信网络是以语音信号为处理对象,计算机网络则是以数据对象为其处理内容。而语音技术为两个网络的结合,奠定了技术基础。

  在为用户服务的过程中,两种网络分别扮演不同的角色。

  语音接入通过PSTN

  目前,人们进行信息交流的主要方式,还是通过电话网。用户可以通过拨打一个电话号码,接入到信息访问中心。

  语音处理依靠计算机网络

  计算机网络最大的优点是处理信息的能力十分强大。因此,采用语音技术,计算机就可以读懂用户想要哪方面的信息,并自动寻找该信息,然后,通过语音技术将信息以语音的形式回放给用户。

  这就形成了一个理想的网络信息访问模式,电话网络负责语音接入,计算机网络负责信息的处理。


  开辟新应用


  语音技术的应用十分广泛。

  金融方面

  采用了语音技术后,通过电话,不用人工的干预,就可以进行账户余额查询,完成账户间的转账等工作。不仅提高了工作的效率,也改善了服务的形象。

  证券方面

  用户通过电话可以查询当前的股市情况,不用再按电话上的按键,而是直接说出自己关心的股票的名称,例如“深发展”,然后计算机就通过语音合成技术,将结果播报出来。这样,用户就不用记那些股票号码了。

  电信方面

  采用语音技术,在电信业务中将产生很多的应用。例如在“114”电话黄页中,目前还要有大量的人工服务,而如果采用语音技术,就可以不用人工服务,让计算机自动接听用户的需要,然后回放查询的电话号码。

  旅游方面

  用户可以通过电话,自动查询那些感兴趣的景点的语音介绍材料,相当于请了一个电话导游。而且出现问题时,也可以通过电话,进行各种求助。

  寻呼方面

  寻呼目前还是通过寻呼小姐记下用户要寻呼的目标号码,然后将内容输入到寻呼系统进行发射。采用语音技术后,可以让计算机自动地进行整个操作过程。

  娱乐方面

  语音技术在娱乐方面,也可以激发出许多的新应用。例如,在通过电话进行电视MTV点播时,可以避免重复地按电话上的按键,而是直接说出哪个歌手的哪首歌,电视台就接受语音输入,而播放相应的曲目。


  面临问题


  可以看到,将来成熟的语音技术将会带来巨大的影响,但目前的语音技术还存在着一些问题,而且,单靠语音技术也是不够的,要和其他领域的知识进行结合,才能产生丰富的应用。

  语音识别技术方面

  目前,在汉语方面,语音合成的技术已经达到了实用阶段,但在语音识别方面,还有很多问题要解决。

  用户的独立性问题:就是如何识别不同嗓音和口音的用户,而无需通过软件训练来实现。

  自然语音理解能力:能够直接了解用户的需要,就像人一样,可以通过几个简单缩语,就可以明白对方的想法。

  插入处理能力:插入能力允许用户在系统提示时中断系统,但系统仍然能够知道用户的请求。

  声纹识别问题:每个人的声音都有一定的特点,是否也能够像识别指纹一样,识别声纹呢?这样许多鉴权应用将十分简单。

  业务策略方面

  业务的应用情况,也取决于业务的管理水平,业务的营销能力、服务水平、售后能力等因素,也同样制约着最终业务的应用情况。

摘自《中国计算机报》



相关链接:
L&H瓦解 语音技术走向移动 2001-06-22
语音合成技术与电信应用 2001-06-06
捷通语音技术又获突破 2001-06-06
统一消息平台中的语音技术 2001-06-04
文本-可视语音转换及其应用 2001-06-04