首页>>厂商>>语音识别与合成>>捷通华声

捷通华声语音技术再谱华章 开启奥运"全声道"

2003/11/21

  当萨马兰奇在莫斯科庄严读出"BEIJNG"这个单词时,记忆中的烙印是全球炎黄子孙奔走相告,热泪盈眶;当中国奥申委提出"绿色奥运,科技奥运,人文奥运"的奥运精神时,扭转的是"黄头发,蓝眼睛"骨子里那颗"偏颇的心",宣言着新北京,新奥运的与众不同;随着流光岁月迈进2008的时钟不断"掐短","绿色奥运,科技奥运,人文奥运"的落实基点无疑越发成为了人们所关注的热点,近日承接十大科技奥运重点项目之一的北京捷通华声语音技术有限公司在多语种语音合成技术方面所取得的突出成绩更成为了的闪光点。

开启奥运"全声道",捷通华声绘彩"科技奥运"

  金秋10月,由北京捷通华声语音技术有限公司全力承担的《面向奥运的多语种语音合成产品研制》项目在北京市顺利通过第一次规定任务评测。至此在该项目的攻关工作中捷通华声已取得了可喜的阶段性成果。《面向奥运的多语种语音合成产品研制》项目是北京市十大科技奥运重点项目之一的《面向奥运的多语言智能信息服务网络系统》中一个重要的子课题,项目的研究成果将被直接应用于2008年北京奥运会期间的综合信息服务系统。业内诸多人士认为,这一阶段性成果的突破,其不单表明了捷通华声强劲的科研实力和技术底蕴,更重要的是这一成果无疑为北京科技奥运开启了多语言"全声道",为2008"奥运之声"弹响了清锐的声道旋律,为北京"科技奥运"的美好远景增添了一道绚丽的色彩。

  北京奥申委在申奥报告中对"绿色奥运、科技奥运、人文奥运"中的"科技奥运"主题郑重承诺:"在2008北京奥运会,Any Time、 Any Where、 Any One、 Any Device都能方便地获取奥运的信息,分享奥运的喜悦。"奥运会是全世界的盛会,而要实现在"任何时间、任何地方、任何人、任何设备"都能够顺畅的进行信息共享,其最为关键的因素之一就是信息传递载体的提供,也就是多种语言信息交流的"中转平台"。为了使奥运信息通过多国语言传递,突破语言障碍实现信息的畅通交流。北京市科委启动了十大科技奥运项目之一的《面向奥运的多语言智能信息服务网络系统》,而该项目中的子课题《面向奥运的多语种语音合成产品研制》,要达到的效果就是借助多种语言的语音合成(TTS)技术,利用计算机将奥运信息,按用户选定的语种通过语音自动播报出来,从而打破语言的界限和隔阂,采用语音这种最自然的人机交流方式,提供信息发布、信息查询、人机交互等多种形式的信息服务,让北京轻松实现科技奥运期间任何人在任何时间、任何地点、使用任何设备都能获取奥运信息的承诺。

  面对这一重大科研课题,北京市科委做出了公开招标的决定。今年4月,在国内众多厂商参与竞争的激烈角逐中,北京捷通华声语音技术有限公凭借多年对该领域的深入探索和对这一项目的潜心研究,过关斩将,一举中标。从2003年4月中标到10月顺利通过第一次规定任务评测,短暂的6个月,捷通华声在多语种语音合成产品的科研工作中取得了突破性进展,标示着北京2008年奥运会期间开启多语种信息传递的"全声道"成为现实。在这样的技术突破与成绩面前,大众多的是鼓舞和信心;业界专家认为这是捷通华声团结协作的精英队伍潜心创新的结晶;捷通华声自己则认为他们的一切得益于根植中国历史文化的浑厚底蕴、得益于产业与社会各界的支持,得益于长期专注的精神、敬业的态度,以服务市场、服务用户为根本导向,走"开放式"合作发展的最终回报。捷通华声作为国内第一家专注从事语音技术研究的民营企业,其成功秘籍何在?

科研与产业,要的是底蕴和基础,光有激情是不够的

  我国著名语音技术专家、科学院声学所研究员、捷通华声首席科学家吕士楠认为,科研难题的突破,光有激情是不够的,它要的依托是文化底蕴和科研基础,要的是方向明确、意志坚定、专注与专业化的团队,捷通华声的成功秘籍就在于此。就以此次所推出的多语种语音合成引擎来看,它是捷通华声继今年5月成功实现日语语音合成技术在国内首创性突破基础上的又一次大胆创新。该多语种语音合成引擎除秉承了其在业界一贯领先的中文语音合成技术领先优势外,在英文和中英文混读语音合成技术方面取得了决定性的突破,使得中英文之间的衔接更加流畅,可懂度,流畅度,自然度的三项技术指标均达到国际领先水平,中英文的合成效果可以跟真人发音媲美,"COPY"性的语音的保真变得不再是梦想。该引擎独特的特点是能够将各种不同语种的引擎以模块化的方式提供,加强了系统的开放性和兼容性,使不同语种的文字能够很方便地加入到这个体系结构中,并且用户也可自由选择所需语种的语音服务。

  捷通华声自成立以来,始终致力于推动中国语音合成技术的突破与语音产业发展,经过多年的潜心磨剑,已是硕果累累,与整个行业一起阔步前进,为行业市场的语音技术开发、培养、引导起到了先驱性的旗帜作用。在科研与产业发展中,坚持走自己路的同时坚持"开放式"合作发展策略,积极与世界众多具有国际领先语音技术实力的企业以及国内高校科研院所展开合作,携手推动语音合成(TTS)、语音识别(ASR)技术在中国和亚太地区的进步和广泛应用,为电信、CTI、互联网等市场提供最完整、最优化的语音技术解决方案。捷通华声始终坚持以市场应用为导向,在严谨的科研态度和团队的协作下,到目前为止,捷通华声已成为国内第一家掌握并可以向市场提供中、英、日等多语种语音合成技术的企业。

  面对成绩,捷通华声并没有满足,而更多是百尺竿头更进一步的不懈努力和追求。据了解,为了能够更好的服务于北京科技奥运,加快产业的发展,捷通华声正在开始新的突破:积极研究发展包括法、俄、德、意等其它多语种语音合成技术。在谈及未来成果应用与语音产业的发展,捷通华声表现出来更多的是坦然。他们认为,"科技奥运"不仅为捷通华声,更为整个产业界提供了一个很好的实力展示的契机,捷通华声将与整个业界合作、共同实现成果大众化、普及化,推动中国语音产业的健康发展,为整个语音产业发展带来新的动向与贡献才是他们根本梦想。

捷通华声供稿 CTI论坛编辑 原文刊登于新华网



相关链接:
捷通华声发布jASR5.5 ASR价格面前将无怯步 2008-04-16
捷通华声TTS成功登陆中国邮政储蓄银行 2008-04-03
捷通华声 jTTS 5.5 全面支持 MRCPv2标准 2008-03-31
捷通华声移动导航HCI解决方案广受青睐 2008-03-26
身边的“智能”生活 2007-12-28

分类信息:  语音合成TTS_与_语音识别ASR     新闻频道   技术_语音合成_新闻   技术_语音识别_新闻