如何为AI造“眼”？华为科学家带你“看懂”世界

　　距离华为开发者大会2020（Cloud）开幕还有两天，让我们揭开计算机视觉奥义的面纱，共同打开智慧之门。

　　终于，计算机视觉技术在中国迎来了它最好的时代。智能图像采集设备的普及，使得机器能够“看清”世界——然而我们并不满足于此：我们的目标是利用人工智能技术，让机器能够真正“看懂”这个世界。

　　这是一个充满挑战的任务，正如华为诺亚方舟实验室计算视觉首席科学家田奇博士指出的那样：

　　“基于标注数据的监督学习所带来的红利期已接近尾声，现在业界亟需高效利用海量无标注数据（数据高效）的新学习范式。”

　　如今，越来越多的人工智能应用需要建立在“看懂世界”的基础上。

例如，受到广泛关注的L4/L5级智能驾驶，需要建立在强大的环境感知基础上——这对计算机视觉技术提出了极为苛刻的要求；
又如智慧城市，如何能在人流密集的街头做到跨域行人重识别（ReID），同样是计算机视觉所面临的巨大挑战；
同时，计算机视觉算法的成熟还将为终端视觉带来质的飞跃，AI技术为图像视频质量增强提供了有力的武器，而超分辨率、失焦修复等也已成为手机摄像的标准配置。

　　总之，面向场景应用的计算机视觉技术，不仅为人们的生活增添了更多便捷，也将进一步推动人类社会走向更加智能与精彩的未来。

　　当然，这一切的背后少不了科学团队的支持。

　　目前，田奇博士带领的团队主要研究重心聚焦在数据高效和能耗高效的计算机视觉基础研究。

　　为了从海量无标签数据中挖掘有用的知识，就需要数据高效的学习算法；而为了让动辄上千万参数量的网络模型在各种终端设备中顺畅运行，能耗高效的模型适配也是他们的研究重点之一。

　　落实到具体业务，计算视觉研究主要针对六大方向：底层视觉、语义理解、3D视觉、数据生成、视觉计算、视觉+X模态。得益于爆发式的应用场景以及AI人才红利，中国的计算机视觉研究也开启了加速模式。

　　当前，由田奇博士带领的研发团队在许多方面已经居于世界领先地位。

例如，在业界公认最为重要的图像分类数据集ImageNet上，田奇博士的团队利用高效的数据扩增算法，在不使用额外训练数据的情况下，达到了85.8%的分类准确率，打破了谷歌多年来对这一赛道的垄断。
同时，利用在自动网络架构搜索方面取得的持续性突破（代表性工作包括P-DARTS、PC-DARTS、Stabilizing DARTS、Latency-Aware DARTS等），团队也能够完成从云侧大模型到端侧小模型的适配，在受限算力下依然保持业界领先水平。

　　在过去一年多的时间里，他们还研发了许多先进技术并中稿了80多篇计算机视觉顶会论文，其中多项技术已经在华为内部多个应用场景中获得验证与应用。

　　这些计算机视觉领域的创新研究进展将在华为开发者大会2020（Cloud）上与来自全球的科学家与优秀AI开发者共同分享。

　　作为大会预告，田奇博士也提前剧透了一个令人满怀期待的消息：

　　“此次他们将发布“华为视觉计划”，他还进一步强调，这项计划的发布，标志着华为将以更积极的姿态，投身计算机视觉前沿探索，与业界一起迈向真正的人工智能时代。”

　　华为开发者大会2020（Cloud）

　　3月27日~28日期间面向全球开发者开启线上直播

　　华为开发者大会HDC.Cloud是华为面向ICT（信息与通信）领域全球开发者的年度顶级旗舰活动，这也是一场包括田奇博士在内的众多大神云集的线上活动。（延伸阅读：华为开发者大会HDC.Cloud 的核心看点，这张图承包了）

　　田奇博士

　　华为诺亚方舟实验室计算视觉首席科学家

　　作为计算机视觉领域的资深专家，田奇博士从事该领域相关研究已经长达20多年：

在美国大学任教期间做了许多基础研究，并于2010年获Google Faculty Research Award, 2017年UTSA校长杰出研究奖。由于在多媒体信息检索（for contributions to Multimedia Information Retrieval）方面的杰出贡献，他于2016年初获评IEEE Fellow、多媒体领域10大最具影响力的学者。
2018年，田奇博士全职加入华为，任诺亚方舟实验室计算视觉首席科学家，主导视觉方向的前沿研究，并落实在终端手机、自动驾驶、网络运维大脑、平安城市等方向上的算法竞争力。
并于2018年入选国家第十四批“千人计划”创新项目，教育部长江讲座教授、国家自然科学基金海外杰青，中国科学院海外评审专家，国家自然科学基金会评专家，在清华大学神经与认知计算中心、中科院计算所、中科大、浙江大学、上海交通大学、西安交通大学、大连理工大学、西安电子科技大学等任讲席教授或者客座教授，并曾在Microsoft Research Asia、UIUC、NEC Lab等多个单位访问工作。
田奇博士是2015年ACM International Conference on Multimedia的大会主席，在2009年任会务主席，2012年任技术演示主席，并在2011-2014、2016-2018, 2020等多次会议中任领域主席。在其它计算机视觉顶会如CVPR、ICCV、ECCV等也多次任领域主席。他是SIGMM Executive Committee Member （2019-2023）和IEEE Circuits and Systems Society VSPC 技术委员会主席（2018-2020）。他同时是IEEE TMM, TCSVT, TNNLS, ACM TOMM、Multimedia Systems Journal等多个期刊的Associate Editor。
他拥有多项美国专利，在计算机视觉及多媒体方向顶级期刊及会议如IEEE TPAMI，IJCV，TIP，TMM，CVPR, ICCV，ECCV，ACM MM, NeurIPS上发表文章约550+余篇（包括250+ 篇IEEE/ACM期刊和150+篇CCF A类会议文章），谷歌学术引用次数超过19300+余次，h-index为69，有7篇论文获最佳论文奖或者最佳学生论文。

　　想知道田奇博士如何为AI造“眼”吗？

　　关注华为开发者大会2020（Cloud）

　　与全球AI开发者一起开启你的智慧之眼！

　　今日份有奖互动

　　关于人工智能

　　你有什么想问田奇博士的呢？

　　下方留言告诉我们

　　3月30日将由田奇博士选出一位幸运儿

　　送出以下奖品

　　华为手环一个