您当前的位置是:  首页 > 资讯 > 国际 >
 首页 > 资讯 > 国际 >

Meta打造全球最快AI超级电脑,预计年中完成

2022-01-25 13:45:39   作者:   来源:CTI论坛   评论:0  点击:


  Meta建造中的AI Research SuperCluster(RSC)超级电脑,包含760个Nvidia DGX A100系统节点,总和达6,080颗GPU,强调能让一个拥有数百亿参数的模型训练时间,从9个星期缩短为3周
  Meta昨(24)日宣布正在打造全球最快AI超级电脑,志在用以训练数兆参数的大型模型,加速实现元宇宙(metaverse)愿景。
  名为AI Research SuperCluster(RSC)的超级电脑预计2022年中打造完成。Meta执行长Mark Zuckerberg表示目前RSC是全球运行中最快AI超级电脑之一,但等建造完成时将成为全球最快。
  目前Meta研究人员已经用RSC来训练自然语言处理(NLP)及电脑视觉(computer vision)研究使用的大型模型。他们希望RSC未来可以处理数兆参数的模型。
  Meta表示由于有些实验要进行好几个星期,且涉及数千个GPU,因此RSC架构必须极稳定,此外又必须好操作以支援研究人员进行各种AI模型的训练。
  RSC由数个运算节点组成,并以高速网络串连而成。Meta表示RSC目前已包含760个Nvidia DGX A100系统节点,总和达6,080颗GPU。和Meta现有训练系统相较,早期标竿测试显示RSC的电脑视觉作业运算速度提升20倍,执行Nvidia Collective Communication Library(NCCL)的速度快9倍有余,而训练大型NLP模型的效能则提升3倍。这表示一个拥有数百亿参数的模型训练完成时间,可以从过去的9个星期缩短为3周。
  其他规格方面,RSC每座DGX节点透过Nvidia Quantum 1600 Gb/s InfiniBand 二层Clos网络架构串连,以减少网络超载(oversubscription)问题。RSC储存系统将采用175 PB的Pure Storage FlashArray、46 PB的Penguin Altus快取储存及10 PB Pure Storage FlashBlade。
  等年中打造完成时,RSC将搭载1.6万颗GPU,而混合精度运算(mixed precision compute)效能达到将近5 Exaflops,使其成为全球最快超级电脑AI。RSC的快取及储存系统设计,未来计画可提供16TB/s频宽及1 Exabyte储存容量。
  目前RSC已经和去年5月美国国家能源研究科学计算中心(National Energy Research Scientific Computing Center,NERSC)揭示的劳伦斯伯克利国家实验室的AI超级电脑Perlmutter相当,后者采用了6,159颗Nvidia A100 GPU。
  HPCwire估计,据现行Top500超级电脑排名,Meta RSC第一阶段约为第4名,完成后浮点运算速度约为227 petaflop/s,可望跃居全球第2快。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业