首页>>厂商>>语音识别与合成>>科大讯飞

语音帝国之梦

张旭东 2002/01/07

  雄心勃勃的科大讯飞,欲把 “嘴巴”与“ 耳朵”拧到计算机上。

  当你面对一台冷冰冰的电脑,问道:“你是谁?”“你今年几岁?”“你的主人是谁?”电脑一字一顿地分别回答说:“我是乐乐。”“我今年两岁。”“我的主人是科大讯飞。”你千万别以为这是魔术。

  靠技术吃饭

  神奇、有趣,这是每一个初次接触语音技术的人可能发出的惊叹。科大讯飞在这方面拥有自己的核心技术——语音合成、语音识别和语音压缩编码是其看家本领。对以上三种技术的区别和特征,科大讯飞总裁刘庆峰有一种形象的比喻:语音合成是让机器能开口说话;语音识别是让机器能听懂人的说话;语音编码压缩是让庞大的语音文件完成压缩,可方便地储存、传输和使用。

  从实验室钻出两年后,28岁的刘庆峰时常表现出充分的自信。其实,刘庆峰的履历极其简单:1991年进入中国科技大学就读,并在该校从学士、硕士、博士一路拿下文凭。1999年11月,因为“首次将中文语音合成技术推向实用阶段”,他与自己的6位伙伴获得科大讯飞668.85万元的技术股权奖励。此后,刘就任科大讯飞公司总裁,开始了寻找将语音技术商业化的征途。

  据科大讯飞技术人员介绍,在独特的前端文本分析、韵律模型和庞大的语料库基础上锤炼出的这一技术,主要具有语音识别、语音听写和语音导航等功能。人说的话可以通过电脑屏幕显示出来;电脑可以像人一样说话;人发出 一种指令,电脑可以遵照完成;根据每一个人的语音特征,电脑可以确认人的身份。这些可以实现人机交互、对话的功能,以其类魔术的形态吸引来各种关注的目光。

  1999年6月,中国科技大学、安徽省经贸委和福建中银集团拿出300多万元,扶助科大讯飞下水起航;同年年底,美菱集团、中国科技大学、安徽省信托、安徽省企投、合肥永信等公司注资,使科大讯飞资本金攀升至3000万元;2001年6月,联想投资公司、国家火炬投资公司给科大讯飞再次注入大额资金。来自社会的各种势力看好刘庆峰及语音技术,使科大讯飞这样一个纯高校概念的小公司迅速走出实验室,进入产业化快车道。

  目前,刘庆峰麾下已经聚集了200多人的队伍,这些人雄心勃勃,欲图齐力打造一个语音帝国。

  打造商业链

  2001年10月7日,辽宁五里河体育场,中国足球队冲击世界杯的比赛正在进行。不少球迷纷纷拨打十强赛热线电话16840168,详尽地了解出场队员情况、赛况、花絮等资料。

  “这只是科大讯飞语音技术的一种应用。”刘庆峰这样说。在他看来,语音技术可以应用于办公、教育、游戏软件,以及各种基于语音技术的动态、海量信息实时查询平台,语音服务器、语音商务平台等;此外该技术还可以在智能信息终端、信息家电和智能玩具等嵌入式系统中大显身手。比如,采用语音技术的教育软件,当孩子看到一首唐诗的文字和插图的同时,还可以听到用标准普通话朗诵的声音;在游戏中,原先出现在虚拟人物头顶上的文字将被取消,你听到的是活生生的话语;一台嵌入语音芯片的冰箱,假如你对它下命令:“打开!”冰箱真的就会敞开;一辆玩具小汽车,你命令它往前它就往前,你让它拐弯它就拐弯。

  在刘庆峰看来,语音技术应用的范围极其广泛,到2005年,因该技术拉动的产业规模将能达到1000亿元。

  2000年5月,科大讯飞在中国科技大学、中国科学院声学研究所和中国社科院语言研究所中分别成立了联合实验室,这些实验室所有研究成果的产业化权利,都将由科大讯飞独家应用;与此同时,还成立 了“中国中文语音创业联盟”。“这是在语音技术从实验室走向产业化前夕,将我国最强的科研力量进行的一次集结。”刘庆峰说,“我们要打造一个强大的语音技术平台,让厂商开发各种应用,从而生产出千奇百怪的产品。”

  其实,建立一个语音技术核心平台,让各行各业的软件开发商、系统集成商以及运营服务商在此平台上进行二次开发,进而推出新型产品,正是科大讯飞的企业发展战略。

  从1999年底到现在,在科大讯飞的语音软件平台上,已经聚集了中国IT领域中可能会应用到语音技术的各个方面的210多家开发厂商。这些厂商名单中包括中国电信、海尔、联想、实达、TCL等巨头。

  “产业太庞大,我们无法吃独食。对于从科大讯飞手中拿到语音平台的二次开发商,我们会对其开发人员进行培训,对他们所构架的应用方案给予咨询支持;另外,所有合作伙伴的开发经验我们都将拿出来共享。”刘庆峰说,“现在正是我们的二次开发商紧锣密鼓开发新产品的关键时刻。到明年年底,经过产品开发期、测试期、市场推广期之后,你会在很多领域看到语音技术的大范围的应用。”

  很明显,科大讯飞希望站在产业链的上游,靠出让自己的语音技术平台生存。

  刘庆峰雄心勃勃地说:“中国最著名的IT公司中,方正的看家本领是汉字照排;四通借汉字打印机成名;联想靠汉卡起家。我们正努力使科大讯飞成为他们之后的下一个。”将公司发展成为全球最大的智能化多语种语音技术提供商,这是刘庆峰最终的梦想。其实,在今年9月份,科大讯飞已经推出了一款很吸引人的产品——中英文混读系统。

  在一项技术变成一个庞大的商业生态圈时,人才、资本、管理、市场等等诸多因素都可能成为其前进道路上的陷阱。而且,正在往前奔跑的科大讯飞,突然在自己身边发现有很多强大的竞争对手——微软亚洲研究院、炎黄新星、捷通等厂商都在研发中文语音技术平台。---虽然有人要分吃同样一碗饭,虽然前路坎坷,但刘庆峰依然信心十足:“我们手头有5000万元的现金,我们有200多人的队伍。到明年年底,你会看到一个围绕科大讯飞的语音帝国的雏形。”

科大讯飞供稿 原文刊登于《IT经理世界》