首页 > 新闻 > 国内 >

语音识别创业公司云知声换帅 黄伟从幕后走向台前

2013-12-25 14:21:58   作者:   来源:腾讯科技   评论:0  点击:


  语音识别领域的明星创业公司云知声正在经历一场隐秘的高层架构调整。

  腾讯科技独家获悉,公司CEO梁家恩不再担任公司CEO,转而专注负责技术领域。公司CEO由黄伟担任,正式上任已有一周有余。

  云知声的官方网站侧面印证了该消息的真实性。云知声在公司内部的新闻稿通报,云知声荣获中国最具投资价值企业50强的称号,云知声CEO黄伟出席了本次大会并领奖,新闻稿并配了黄伟领奖的照片。

黄伟

  在外界看来,这似乎是空降兵式的调整。在语音识别业内的知情者看来,则是语音识别产业核心人物的回归。

  “黄伟终于回归了,终于从幕后走向了前台”。一位语音识别的业内人士这样感慨。

  黄伟是谁?作为语音识别领域的领军人物,他先就职于摩托罗拉和盛大创新院,建立了盛大创新院语音分院,后随着盛大整体战略的调整,他于2012年离职选择创业。

  对于黄伟创业的说法不一。盛大创新院员工表示,黄伟是盛大创新院高管中最早离开创新院的,他去创办了云知声。但在此前,云知声官方否认黄伟在这个团队中。

  今年10月,云知声确认完成启明创投的A轮融资,金额达1亿人民币,此时,云知声公司成立刚过500天。云知声的迅速蹿红也引起了业内人士对它的关注,也牵出了黄伟与云知声的联系:“黄伟不是明面上的公司创始人,更多的是和云知声私下里的关系。虽然没有确切的证据表明两者的关系,但实际上千丝万缕,两者走的非常近。”一位知情人士透露。

  腾讯科技获悉,此次黄伟正式担任CEO,与其从盛大离职后的竞业禁止协议解禁有关。“云知声这一年的飞速成长,与黄伟的幕后操盘紧密相关。”上述人士表示。

  对此安排,有知情人士透露,黄伟对资本方等较为熟悉,更容易掌控全局。梁家恩是典型的技术型人才,专注技术更为适合。“在盛大创新院时黄伟是梁家恩的领导,创业后先由梁家恩担任CEO,黄伟在幕后。条件许可后,黄伟再走到前台,这很顺利成章。”

  作为创业公司,云知声一年的成长有目共睹。“在语音识别领域,百度已经做了一年多,云知声也做了一年多,但是云知声的识别技术比如识别的准确度已经比百度高出一大截。”一位语音识别的从业人士这样评价,“在语音识别的创业公司中,云知声是做的最好的。”

  梁家恩把创业的阶段性成功归因于强大的核心技术团队和平台技术团队,能够在一年时间里,实现上市公司需要3-5年才能构建的语音识别服务平台。“一年来,语音识别错误率下降60%,识别速度提高3倍以上。”云知声CEO梁家恩对腾讯科技表示。

  在这个节点上,在语音识别领域的大爆发的前夜,复盘云知声一年的黑马式崛起,颇有一番意味。

  语音识别产业大爆发

  “所有手机制造商都在投资语音、拓展语音技术领域的投资,打造更优雅的设计并 将其深入集成到手机中。”美国最大的语音识别技术公司Nuance高级副总裁迈克尔?汤普森这样说。

  在推出Siri应用两年后,今年苹果在麻省理工大学 (MIT)附近组建神秘办公室,用以做Siri 语音识别技术的研发。微软正在研发代号为“Cortana”自有语音个人助手软件,并计划在下一个Windows Phone平台大升级中推出,以抗衡Google Now及Siri。至此,苹果、谷歌(微博)、微软、英特尔等国际巨头均重金投入语音识别技术。

  在中国市场上,语音识别技术公司也有几大派别较力:

  第一派来自互联网巨头在语音识别技术上的布局,比如腾讯、百度、搜狗等围绕自己的产品生态系统做语音技术,用来为产品服务。微信的语音对讲应用已经成为人们日常联络的必备。360也有意进军语音识别领域,曾传出与科大讯飞谈合作事宜,但至今未有明确信息。

  第二派来自专业的语音语义识别公司在移动互联网上的延伸。比如科大讯飞去年专门成立移动互联网事业部做移动应用,美国的Nuance在上海也设立办事处拓展以多语种语音识别应用为主的中国市场。

  第三派来自于新兴的创业公司,如云知声、思必驰等,具有互联网公司的基因,长 势凶猛。还有一派专做部分语音语义技术的应用,比如擅长语义解析的虫洞(获微软首期云加速器项目支持)、智能360(周鸿祎(微博)做天使投资),以及做微信语音 生活搜索的出门问问(前谷歌语音识别技术员工李志飞创办),他们自己做语音语义识别应用的一部分,另一部分技术会借助科大讯飞等厂商的技术来完成。

  刚刚过去的几个月,基于语音识别技术的角力进入前所未有的白热化阶段。 9月7日,创业公司思必驰宣布重新定义人机交互体验的方向,高调推出基于语音识别和语义理解的人机对话。9月中旬,老牌语音技术公司科大讯飞宣布自主研发的离线语音听写引擎将于9月下旬正式发布,将应用于“讯飞输入法”等产品。10月19日,云知声在确认融资消息的同时,也发布了离线语音听写技术,并发布了语义云。今年10月28日,科大讯飞语音云发布三周年,讯飞语音输入法用户超过1亿。

  黄伟的故事

  在这轮语音识别技术热潮中,有个身影本该成领头羊但却落寞四散缺席,那就是盛大。

  与科大讯飞相比,盛大当年的语音识别技术并不弱。曾经领导盛大的语音识别团队的核心人物是黄伟。同刘庆峰一样,黄伟毕业于中国科学技术大学,2004年加入摩托罗拉中国研究中心(MCRC)担任资深研究员。在摩托罗拉工作期间,他带队开发出世界上首个手机声纹认证系统,并完成多项语音交互产品研发。但在金融危机期间,摩托将整个语音识别团队出售给Nuance。

  黄伟拒绝被Nuance收编,于2009年7月加入盛大网络旗下的创新院,2010年10月创建了语音分院,力图将语音识别技术与盛大旗下的互动娱乐系统相结合,延展到用户端。

  2010年,盛大语音团队在美国国家标准技术署(NIST)举办的声纹识别评测(SRE)大赛中,力压麻省理工、斯坦福研究中心、IBM等众多名校、名企,在在9个单项任务中获得5个单项第一,整体综合指标第一。

  梁家恩毕业于中国科学技术大学,随后进入中科院自动化所工作,2011年加入 盛大创新院,在盛大语音分院工作,担任高级研究员一职。不过,随着2012年盛大创新院的战略调整,语音团队从创新院剥离到盛大掌门科技,由陈大年掌管。语音团队的成员开始各寻出路。

  盛大语音团队的几个人选择了创业,同样做语音识别,定名为“云知声”。但云知声更倾向于强调自己的技术积累来自于中科院自动化所,而非之前曾工作过的盛大。

  黄伟在其中的角色耐人寻味。

  2012年夏天,盛大创新院离职员工QQ群里,传来了黄伟创办云知声的消息。一位前盛大创新院员工表示,“黄伟是盛大创新院高管中最早离开创新院的,他去创办了云知声。”

  但云知声官方否认黄伟在云知声团队中。

  来自云知声的官方消息显示,公司创始人有两位,一位是梁家恩,担任公司CEO,另一位是康恒,担任公司CTO,负责平台业务部。

  对于黄伟与公司的关系,腾讯科技曾向云知声市场负责人求证此事。该负责人表示,“黄伟和我们公司没有什么关系。”但他也表示,黄伟和梁家恩是师兄弟关系,也会指导云知声的业务。

  云知声的内部人士透露,黄伟离开盛大研究院后创办了移动互联网应用音乐雷达,和云知声团队在同一座大厦办公。网站信息显示,两家公司都在北京海淀区财智国际大厦C座,云知声在15层,音乐雷达在19层。

  音乐雷达的一家合作伙伴的负责人证实黄伟是音乐雷达的创始人之一,并和黄伟谈过音乐方面的合作。对于外界对黄伟和云知声之间关系的猜疑,他表示,“不出面创立公司,但可能通过代持的方式运营公司,这在圈里也比较正常。”

  互联网的节奏

  对云知声而言,过去一年来,以快取胜、唯快不破的节奏在语音识别领域快速扩张业务,打造知名度。在与其他公司的语音技术解决方案不相上下的情况下,云知声采取先抢占市场后再优化的策略。

  去年11月,云知声和搜狗语音助手达成合作,今年3月,和锤子科技达成合作,5月和乐视TV达成合作,8月又和inwatch、易信达成合作。云知声和科大讯飞比肩一道出现在在小米、联想、智能360语音助手等很多合作伙伴的语音识别方案中。

  梁家恩透露,从和搜狗团队见面到第一个产品模型出来只花了两个星期,而这个时间可能其他公司连商务条款还谈不下来。乐视电视的合作也类似,从第一次和乐视团队接触到内部系统跑通到在发布会上发布只用了1个月的时间。

  还有一个合作客户——锤子科技。CEO罗永浩出了名的挑剔。今年,锤子ROM发布会前一周,老罗在抱怨语音识别方案迟迟未出,当晚云知声公司CTO已经将产品集成和锤子科技团队进行对接。最终,云知声和科大讯飞同时入围锤子ROM的语音解决方案。

  与之前的课题研究迥然不同,梁家恩发现,创业一年来,团队一直纠结技术层面的东西,他认为和实际业务结合更关键,也更重要。“做成也是技术好,做失败也是技术好”。

  自去年发布语音识别公有云以来,平台上已经有1000个开发者加入。通过该开放平台,“可以把门槛降得足够低,开发者无需懂具体的语音语义技术,只需要调用云知声的服务,就可做应用创新。”

  在开放平台背后,隐藏着云知声的商业模式逻辑:通过语音语义平台将各家的App联通,用户数据也会集中到平台上,将各个环节贯通从而实现广告等商业价值。

  梁家恩把它比拟为一种类似Google adsense的模式,虽然每家的量很小,但是通过聚合可以产生商业利益,各个参与方可以分成。

  互联网的创业节奏让云知声尝到了甜头,接下来也有风险和挑战。

  一个是来自平台化的风险。“腾讯、百度做语音识别都是围绕自己的主营来设计,在生态系统内来做,也会进行开放平台的建设。”上述语音识别的从业人士认为,相比较其他已经有稳定商业模式的公司涉足语音识别应用而言,初创公司做平台的风险更大。

  对云知声而言,另一个隐忧是尚未有核心的移动互联网产品。目前来看,云知声尝试做语音输入法插件,但主要业务是从语音识别解决方案切入,走技术驱动路线。“创业公司必须有自己的产品和服务,没有产品,很难承载用户数据,商业利益挖掘更难。”

分享到: 收藏

专题