首页>>>技术>>>语音应用>>>语音合成(TTS)  语音合成产品

Google翻译工具凭啥跨越语言障碍

2011/03/29

  出国旅游不懂当地语言怎么办?没有问题,只要你的手机上装有Google(谷歌)翻译工具,你对着它说句中文,它就能立刻翻译成当地语言,并直接“念”出来。

  Google翻译这款产品诞生至今,一直在坚持创新,从网页版到工具栏,再发展到今天移动版,虚拟键盘、可选择翻译、朗读等功能也相继推出。“Google希望支持用户多样化的输入和输出,以便更加轻松地跨越语言的障碍。”近日,Google翻译研发经理陈雍昇在位于北京清华科技园的Google北京办公室接受了《计算机世界》的专访,为我们揭开了Google翻译背后的技术面纱及其所承载的Google整体产品战略的重要使命。

  懂得更多 全凭云统计

  2004年,Google创始人之一塞吉·布林(Sergey Brin)使用市面上的网络翻译服务来翻译韩国粉丝的邮件,结果显示:“生鱼片带着它的愿望,用Google搜索绿洋葱!”。这一与原意风马牛不相及的翻译结果使塞吉下定决心要使Google做出靠谱的翻译产品。

  如今,Google翻译早已是很多人出国旅行和外文写作的必备工具,而Google也成为世界上最大的在线翻译服务提供商,实现了跨语言搜索信息,并可将搜索结果和网页等资讯以母语传递给用户。目前,全世界超过1000万人使用的语言约100种,而Google翻译已经实现了对其中58种语言的支持。“虽然机器翻译并不完美,但它可以让非母语用户接触到之前无法触及的世界各地的信息。”

  “值得注意的是,Google翻译是个自动翻译机,也就是说,它借助的是技术而非人力。” 陈雍昇指出,当下大部分的商业翻译系统都属于规则法机器翻译,需要做大量词汇与语法的工作。不同于它们,Google翻译是先往计算机内输入大量的文字文本,涵盖目标语言的文本和对应翻译文本中现有的人工翻译数据,然后构建统计翻译模型。

  每年,Google都会从一些政府部门、学术机构搜集翻译信息,完善自己的平行语料库,所谓的平行语料就是两种语言的对应词组或者句子,比如,“long”的平行语料是“长”、“time”的平行语料是“时间”,但词组“long time”的平行语料却不能只是两个单词的拼接,而是“很久”,句子“I have been here for a long time.”的平行语料则是“我已经在这里很长一段时间。”而为了保证翻译质量,除了严格限制平行语料的来源,Google还采用了国际认定标准Bleu Score来分析、调试平行语料的质量。

  在采访中,陈雍昇特别指出,Google翻译之所以采用统计翻译模型一个重要原因就是Google的云计算架构。机器翻译需要海量的数据存储空间以及高效的运算能力,而Google拥有GoogleMapReduce(分布式计算系统) 和BigTable(分布式存储系统)正好满足了这两方面需求。

  所以从表面上看,支持的语言种类多和必须在线使用是Google在功能上与市面上同样流行金山词霸、有道词典等翻译工具的功能区别,但背后最大的不同却是,Google在云计算支撑下的统计翻译模型。

  整合信息 人人皆受益

  “整合全球信息,使人人皆可访问并从中受益,这是Google的始终秉持的信条,也是它的产品战略”,陈雍昇表示Google翻译虽然并不是Google最大的研发部门,但它与Android、Chrome甚至Youtube一样,都是为Google实现整合全球信息的目标服务的。

  Google希望将分散在全球各地的,所有可以数字化的,不同语言、不同格式、不同类型、不同版本的信息,进行分析处理后,以最简便的方式提供给用户使用,无论这些内容是来自某个地区的方言、书本或多媒体的内容,或是地图等基本的生活信息。这也可以解释为什么每次技术论坛上,Google都会在翻译这款产品上大费唇舌,因为它代表了一种理想化的沟通形态,即全球信息的无障碍流通。

  回到翻译这款产品,有数据显示,世界上超过99%的人每天的沟通都要靠母语,但在互联网上,英文信息占了80%,在剩下的20%中,法语占其中的大约5%,中文等其他语言信息所占百分比微不足道,至于其中的精华信息,更是少之又少。以阿拉伯语为例,世界上有8%的人说阿拉伯语,但是只有1%的网站使用阿拉伯语。这就是Google为什么如此重视一款小小的语言工具——为了让每个人都能无语言障碍地,轻松地访问网页。

  而除了对不同类型、不同语言信息的横向整合,Google还强调对自己的产品体系进行纵向纵横。从2010年开始,有不少用户发现,Google已经在Chrome浏览器中整合了Google翻译。当Chrome用户访问与电脑系统默认语言(或是浏览器语言)不同的其他语种网站时,Chrome浏览器就会出现Google翻译工具栏,只要单击“翻译”按钮,Google翻译将把整个网站翻译为系统默认语言。当然,用户也可以让Google翻译将把整个网站翻译为其他语言。

  此外,据记者了解,目前,Google 翻译可以帮助用户阅读搜索结果、网页、电子邮件、YouTube视频字幕以及其他信息,用户甚至还能在Gmail内进行实时的多语言对话。事实上,刚刚在苹果AppStore上线Google翻译并不是第一个移动版,因为早在一年前,Google就已经在自己的移动操作系统Android推出了Google翻译工具,而今年Android 版Google翻译又再接再厉推出了聊天模式(Conversation Mode)(目前只支持英语和西班牙语之间的互译),其主要功能是让使用者透过 Android 手机来实时翻译,为原本语言不通的人建立沟通桥梁。

  “在未来,而众所周知,在现实中的翻译行业,专业化、个性化是很重要的一环。”在采访的最后,陈雍昇也表示,除了坚持在翻译质量、速度、用户体验方面进一步挖掘潜力,未来Google也正在翻译个性化上努力,以提供给用户更多样、精准的选择。

计算机世界



相关阅读:
美国移动支付系统制造商VIVOtech准备2012年上市 2011-03-29
黑莓将在广东推个人服务 已进入最后准备阶段 2011-03-29
多家银行上线iPhone手机银行客户端 争夺高端用户 2011-03-29
卓望酝酿业务调整 梦网模式或终结 2011-03-29
移动社交应用市场进入“虚热”阶段? 2011-03-29

热点专题:  语音合成TTS 语音识别ASR    移动增值
分类信息:  移动增值_与_语音应用  移动增值_与_互联网  移动增值_与_移动  移动增值_与_互联网
相关频道:  增值电信新闻