您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

全球顶会SIGCOMM录用智能无损独创技术论文!

2021-08-24 09:32:33   作者:   来源:CTI论坛   评论:0  点击:


  近日,华为超融合数据中心网络智能无损技术论文《ACC: Automatic ECN Tuning for High-Speed Datacenter Networks》(高性能数据中心网络中的ECN动态调优)入选ACM SIGCOMM 2021,表明超融合数据中心网络的智能无损技术得到业内专家的一致认可,具有世界级技术影响力。
  SIGCOMM是美国计算机协会在通信网络领域的旗舰型会议,也是目前国际通信网络领域的顶尖会议。SIGCOMM对论文的质量和数量要求极高,质量方面要求具有基础性贡献、领导性影响和坚实系统背景。SIGCOMM录用的论文大多数会被广泛引用,具有非常大的影响力。
  全无损以太核心算法:独创Automatic ECN
  本次入选的ACC(Automatic ECN)技术是华为全无损以太网络智能无损技术的代表。当今,随着AI和云业务发展,数据中心承载着诸多需要高带宽和低延迟的应用,包括大数据处理、分布式存储和高性能计算。而在已经广泛部署的拥塞控制方案中,显示拥塞通知(ECN: Explicit Congestion Notification)在保障网络和业务高带宽低时延中起到关键作用。但是传统的静态ECN参数配置,无法自适应数字时代种类繁多的动态业务流量模型。
  例如,在不同厂商交换机、网卡等组成大型异构数据中心网络中,协同联调静态ECN参数变得非常困难;尤其在云多租户网络中,存在不同时空流量模型,导致网络工作负载动态变化,需要不同时间点适配ECN参数,事先配置的ECN参数则无法满足动态业务流量的性能需求。因此,在大规模高速组网和多租户业务流量等复杂场景下,人工调整全网适配ECN参数成为巨大挑战。
  基于此,华为联合南京大学设计和实现ACC。ACC通过在超高速数据中心交换机中首次成功应用深度强化学习(DRL:Deep Reinforcement Learning)技术,自适应流量模型来动态调整ECN参数,从而简化网络运营,实现网络高利用率和低延迟。同时, ACC设计分布式多智能体技术实现大规模组网下可扩展性、基于商用交换芯片Telemetry能力实现快速可部署性、结合在线和离线训练方式提高场景的可泛化性,从而最终达到大规模高速网络的高吞吐和低时延性能目标,并且从业务层面保障应用性能表现最优。
  华为超融合数据中心网络CloudFabric 3.0,新以太释放新算力
  在ACC理论研究基础上,华为推出了超融合数据中心网络CloudFabric 3.0解决方案,保障网络高吞吐低时延,100%释放算力。
  华为超融合数据中心网络CloudFabric 3.0解决方案基于全以太架构构建0丢包的计算和存储网络,助力算力100%释放。该方案打破通用计算、存储、高性能计算三套网络架构的限制,统一使用以太网架构实现流量承载融合。该方案在业界率先实现L3自动驾驶网络能力、全生命周期自动化与全网智能运维,OPEX降低30%,使能企业智能化升级。
  华为数据中心网络已经在全球包括金融、政府、互联网、制造、能源等各大行业客户的数据中心部署。华为将持续投入智能无损技术研究,持续提升网络能力,充分释放算力,使能企业智能化升级。
  查看论文:https://dl.acm.org/doi/10.1145/3452296.3472927
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业