您当前的位置是:  首页 > 新闻 > 国内 >
 首页 > 新闻 > 国内 >

阿里巴巴:世界级音频专家冯津伟入职人工智能团队iDST

2017-11-30 11:28:49   作者:   来源:CTI论坛   评论:0  点击:


  11月30日,前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST,担任智能语音交互团队研究员,将负责语音交互设备端的声学设计和信号处理研究工作。
  这是继今年6月任小枫入职后,iDST迎来的又一位大牛级人物。
  冯津伟曾就读国内声学研究机构南京大声学研究所,师从音频声学泰斗沙家正先生,并与导师一起研制出了全球第一台扬声器纸盆共振频率的自动测试系统,极大地帮助了国内的电声行业提高生产效率。冯津伟博士毕业于在主动降噪领域着名的弗吉尼亚理工大学VAL实验室。
  Polycom是语音和视频协作解决方案领域的全球领导者,占全球视频会议市场份额第一。冯津伟曾在Polycom工作17年,拥有十余项美国专利,大部分已产品化,是名声在外的世界级音频专家。他曾主持开发基于麦克风阵列的视频跟踪系统,即在多人视频会议时,摄像头能基于方位和距离,精准定位发言人,产品创新性引业内效仿。
  阿里巴巴iDST语音团队负责人鄢志杰表示:
  冯博士的入职,是物理学和互联网间的‘跨界’。阿里严肃看待智能语音交互技术全链路,逐步组建世界级专家团队。从源头和信号采集开始,在端上做突破性的智能语音交互体验。
  此前,iDST语音团队的技术成果已通过阿里云人工智能ET等对外输出,在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。全国有近300家法院和超过6000家法庭在使用ET,每年有超过1.2亿次客服电话由ET协助人类接听。
  在语音交互产品方面,阿里iDST研究的技术平台能够精准转换用户的语音为对互联网内容和服务的意图,触达手机、IoT设备、互联网汽车、电视、智能音箱等各类终端,如与斑马网络、上汽合作的的荣威互联网汽车、与海尔合作的人工智能电视等。
  冯津伟入职后将依托其在声学与信号处理领域的背景,主持领导语音交互设备端的研究工作。声学是物理学分支学科之一,研究媒质中机械波的产生、传播、接收和效应。以时下最热门的智能音箱为例,如何选择麦克风的材质、摆放位置、结构,就是声学设计要解决的问题。
  关于加入阿里巴巴,冯津伟认为是一次全新的机会。他表示,过去自己的专业知识基本用于会议模式,而未来阿里丰富的智能交互场景将为声学设计与信号处理的发展提供宝贵的实战经验。
  冯津伟的研究方向为“下一代人机自然交互技术”,该领域已经得到阿里巴巴重点投入,此前成立的“达摩院”就包含这一研究领域。
  阿里巴巴iDST透露,冯津伟已参与一秘密项目开发,项目在全球没有先例。
  速记员
  阿里云的人工智能ET在综合了iDST的语音能力后已在全国近300家法院和超过6000家法庭承担起“书记员”的角色,在现场做同步的庭审记录,且在试点中准确率高达96.%。而此前ET曾凭准确率0.67%的微弱优势战胜第50届国际速联速记大赛全球速记亚军姜毅。
  智能客服
  阿里云还推出了智能语音客服机器人“云小蜜”,它支持中文英文会话,可以7*24小时在线工作。目前,已覆盖阿里巴巴生态圈二十余个业务线,每天服务600万客户,问题解决率达到95%。每年有超过1.2亿次客服电话由ET协助人类接听。
  智能音箱
  今年双11,阿里人工智能实验室的首个智能语音终端——天猫精灵,创造了破100万台的惊人销量,其强大的声纹识别能力正来源于过往阿里在语音技术上的积累。
  互联网汽车
  上汽与阿里耗资十亿打造荣威i6互联网汽车也在智能语音交互上有亮眼表现,通过斑马智行App,驾驶员可以通过语音指令实现车辆的语音控制、智能导航、娱乐影音的选择保证了车辆的动态安全。同时如果车内温度过高或者过低,通过唤醒语音交互界面之后,仅需说出“太冷”、“太热”系统就可以识别用户的需求从而做出相应的反馈。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题