首页   新闻  文摘   行业   产品  技术  厂商  标准  BBS  导航  搜索
呼叫中心 | CRM | 统一通信 | 企业通信 | VoIP | 视像通讯 | 语音应用 | 热点专题
首页>>>技术>>>语音应用>>>语音识别(ASR)  语音识别产品

语音技术应用的现状和未来

2004/09/30

  2004年2月对于从事语音方面技术研究和产品开发的人士来讲,是一个值得纪念的日子。

  中国教育部副部长吴启迪在"大学英语教学改革试点工作视频会议"上指出,大学英语教育改革试点工作将从2004年2月在180所高校中开展,时间为一年。在此次改革的试点中,主要是突出对学生英语实用能力的培养。同时,提出和研制出了一流的多媒体、个性化的学习软件和新的教材,以改变过去的黑板、粉笔加教材的单一教学模式。

  这个规定是一个外语教学的多米诺骨牌。这些规定的出台,不但对大学的外语教学提出了要求。在一定程度上也引导了中小学外语教学的发展方向。目前语音研究情况如何,能否适应外语教学改革的要求?带着这些问题,我们走访了北京华育时空信息技术研究院刘金增院长。

语音技术研究和应用现状

  从目前语音技术的研究现状来讲,技术已经有了很大发展。语音识别和语音合成技术是实现人机语音通信及建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话和听懂人说话的能力。

  语音识别技术主要包含几个方面:语音控制、电子发声、连续语音识别、非连续语音识别和语音学习。目前主要是在支持中英文,实现中英文混合识别问题上,存在一些障碍。同时在识别大量词汇和个别发音方面还很难做到准确。作为语音识别技术新方向的语音学习,它则要求人模仿标准发音,其面临的困难是如何衡量人模仿的好坏。

  和语音识别相比,语音合成技术相对说来要成熟一些,是该领域中近期最有希望产生突破并形成产业化的一项技术。语音合成技术是计算机"开口说话"的关键,现阶段语音合成的最大进展是已经能够实时地将任意文本转换成连续可懂的自然语句输出,相应技术通常称为文语合成或文语转换(TTS)。TTS使得数据通信和语音通信在终端一级实现交融,人们将有望在获取Internet信息时,使短消息服务、电子邮件等多数以文本方式提供的信息也用语音的方式输出。语音合成的主要功能是:根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。

  语音合成技术的应用范围非常的广,如电话查询、话费催缴、呼叫中心、证券股票查询、教育系统资料查询等各类都有应用,在面对教育市场就主要是语音教学。

  目前的语音室功能都是基于语音教学功能上,传统的教与学还是占主导,教育部曾委托高等教育出版社、清华大学出版社、外语教学与研究出版社及上海外语教育出版社研制开发了四个版本的教学系统,并且远远不止这些研究机构,包括中科院也同样在研制一些有关语音方面的技术和产品,这为语音合成方面的发展和成熟做出了一定的推动作用。在课堂上学生通过语音平台听说练习,将学生的学习过程评价与终结考试相结合,对学生学习评测与对教师教学评估相协调,多层面、多角度、多环节地测试学生的英语实用能力。

  在基础教育领域,目前语音方面的产品并不是很多。但基础教育的市场是巨大的,而且是很有前景的。刘院长希望能够通过自己的努力和合作,开发出适合基础教育的语音产品。

语音库的建设的关键所在

  现在语音识别技术存在的一些瓶颈主要在于:方言或口音会降低语音识别率、背景噪音、"口语"的问题:它既涉及到自然语言理解,又与声学有关,口语的语法不规范和语序不正常的特点会给语义的分析和理解带来困难,有些很不自然的合成效果往往是因为没有能正确的使用合成与识别系统而导致的,并不是说是合成技术的不成熟,而是语音库的完善度存在一定的差距。

  在教育部所提出的学生考核中有这样的一个方面,考务人员要对学生口语成绩作出评估,但就目前来说是比较困难的,2003年我国高校在校生就已经达到了1900万,而从事大学英语教学的教师仅5万人左右,如此大量的在校生如果用传统的一对一教授方法是远远无法完成教学任务的,那么这些工作大部分都需要求助于计算机软硬件的实现,而实现这种可能就需要很完善的语音库。

  刘院长指出,我们国家目前的语音库建设相较国际水平还是有些差距,合成出来音质达不到高要求,对语音识别还没有特别突出的成果,主要还是资源的缺乏。在现有的语音库里大部分是女声,男声只占有很少的一部分,其他年龄阶段的数据就更加的少,这对我们进行情景对话,进行语音控制,进行模拟现实,进行时实语音评估等都存在一定的困难。诚然有许多的科研机构都在涉及语音识别技术这方面的研究,但对于语音库的建设就有一定的困难性,这是一项需要大投入时间、人才、资金的项目,国内目前只有少数几家走在前端的企业在做这一市场,正致力于解决困扰语音识别领域的某些技术缺陷,突破大量词汇、连续语音、非特定人的三大障碍。刘院长说,"国际上大的IT企业都非常看好这块语音的尖端市场,我觉得语音识别技术是以后IT界未来十年中具有强劲潜力的发展方向"。

语音技术的未来

  未来的语音技术将在智能化等方面有较大发展。在未来我们会生活在这样的世界里:当我们深夜回到家中,为床上熟睡的孩子盖好被角,并将宠物猫咪带出房间后,我们将大声向机器发出指令,说出我们想做的事情由语音设备完成执行,这并不是科幻,而是语音技术发展的结果。

  语音技术发展将在不同应用领域得到突破,并逐渐普及。在教育方面,语音技术的应用将会对语言教学和科研带来很大的影响。

hc360慧聪网教育行业频道


发表评论


  ·Dialogic IP呼叫中心及增值业务主题研讨会  [11月27 成都]  
  ·面对严峻经济形势,如何降低联络中心成本  [11月26-28 上海 北京] 
  ·招聘:亿迅(中国) 拓敏信息 易谷网络 盈联信息 商路通 怡海软件

  ·《2008中国呼叫中心产业发展研究报告》    免费下载简本  
  ·最新资料:《企业呼叫中心建设指南》 《企业通信案例及方案大全》
  ·免费索取:《多媒体交换机资料》   技术前沿资料:《IP、无线和视频方案》

  ·东进Seegoe Enterprise/Office呼叫中心产品介绍
  ·新太科技企业呼叫中心解决方案
  ·TTS在线演示:InterPhonic 5.5系统

            


企业会员
井星科技 Voxeo FDS
上海盈联 易宝通讯 三汇软件
加入办法 ->





CTI论坛推荐
·鼎晟DS-iTouch联络中心
·新太科技企业呼叫中心解决方案
·上海维卡推出VN系列电话语音卡
·CTstage 5i客户联络中心-适用大规模分散网点
·三友亚星:上海红孩子电话营销和客服系统
·什么是IP分布式呼叫中心
·语音合成:InterPhonic 5.5在线演示系统
·东进技术:Seegoe Enterprise/Office呼叫中心
   
相关链接
CTI论坛周刊 融合通信专栏
行业案例汇编 免费发布新闻
管理员俱乐部 服务与营销论坛

热 点 专 栏
|业界新闻|论坛文摘|行业应用|产品展示|技术天地|厂商汇总|免责声明|咨询服务|公司简介|联系方法|广告服务|企业会员|

编辑投稿信箱      如何查找厂商联系方法

电话:010-82012787,82079677   传真:010-62041062
呼叫中心建设及运营管理咨询服务:优胜资讯(010)87768798 87768726