您当前的位置是:  首页 > 资讯 > 文章精选 >
 首页 > 资讯 > 文章精选 >

什么是熄灯数据中心?可能在新应用和边缘采用

2021-03-01 13:53:07   作者:   来源:CTI论坛   评论:0  点击:


  熄灯数据中心其实是一种无人值守的数据中心,也是一种完全实现自动化的数据中心设施,可以更显着地节约能源和管理成本。
  “熄灯”这个术语可以追溯到Philip K Dick在1955年发表的一篇短篇小说。例如在制造行业中,荷兰飞利浦公司的一家工厂在少数质检人员的监督下生产剃须刀;而日本Fanuc公司生产工业机器人的工厂可以长期关闭空调和供暖系统,以使机器人的生产不受干扰。
  当最初构建的熄灯数据中心运营时,其计算机系统仍然需要定期维护和保养。现场工作人员不得不经常进入机房重置服务器或重新连接交换机。
  但这种情况正在改变,如今的IT组件变得越来越可靠。而软件定义网络(SDN)意味着通过软件重新设置服务器或连接网络。采用虚拟化技术使工作负载独立于物理服务器,而采用自动化技术意味着可以远程完成重置和调整。
  多年来,传统数据中心一直通过运营人员管理和维护数百台甚至数千台服务器。除非更换硬件或修复故障,通常不会进入机房。数据中心的机械和电气设备采用自动化技术,而空调制冷系统也可以在无人值守的情况下运行,并且提示工程师或制造商进行预防性维护。
  传统数据中心“浪费”了更多的空间和能源,这是因为需要为运营人员提供工作环境和条件,并设置了满足安全和生理等需求的安全出入口和洗手间等设施。
  熄灯数据中心首次在2011年亮相,美国互联网服务提供商AOL公司当时宣布将采用一种激进的模式,推出名为ATC的小型无人值守的数据中心。AOL公司技术副总裁Mike Manos曾是在微软公司的数据中心专家,他在一篇博客文章对熄灯数据中心的理念表示赞赏,认为这种技术可以从根本上改变一切。
  对熄灯数据中心的宣传和炒作
  但是十年过去了,AOL公司早已不复存在,而数据中心仍然需要运营人员的运营和维护。但熄灯数据中心的的想法一直存在,通常可以采用预先安装服务器的方式将机架安装在这样的数据中心中。
  数据中心设计师指出,如果无需工作人员运营和维护的话,数据中心的机架和服务器等IT设备将部署得更紧凑,在更高的温度下运行,并且大幅削减冷却费用。而抽取空气中的氧气可以防止火灾,减少腐蚀。
  但是事实表明,大型数据中心设施仍然需要配备运营人员。
  Uptime Institute是数据中心可靠性方面的全球权威机构,该机构一直建议数据中心运营人员需要随时准备处理出现的任何问题。该机构的技术专家Richard F.Van Loo在2015年发布的一份简报中说:“对于需要在Tier III级或Tier IV数据中心设施运营关键业务的组织来说,我们建议至少有一到两家数据中心运营商的工作人员全天候在现场工作,而配备适当数量的数据中心人员是可靠运营的关键。”
  熄灯数据中心的发展在此后发生了一些变化,尤其是规模较小的数据中心提供商,例如EdgeConneX公司。
  EdgeConneX公司席信息官Lance Devin表示:“我们的业务是建立在熄灯数据中心的基础上,我们通常部署电力容量为2MW的数据中心,而不是100MW的大型数据中心。因为我们公司无法承担在数据中心雇佣更多的工程师、安全人员以及维护人员的成本。”
  EdgeConneX公司运行了分段管理系统,该系统可让客户控制IT硬件,而EdgeConneX公司则负责管理电源和冷却基础设施。
  但这样的数据中心并非完全熄灯,EdgeConneX公司具有远程控制安全性,因此可以通过蜂鸣器通知客户或运营商的运营人员。
  疫情锁定和熄灯运营
  拥有和运营规模更大的数据中心设施的运营商并不需要这样做。但是他们需要具有远程管理数据中心的能力,由于2020年发生了冠状病毒疫情,这些能力得到了验证。
  当很多组织的员工在家远程工作时,数据中心运营商采用的远程控制服务激增。数据中心运营商QTS Data Centers公司首席技术官Brent Bensten表示,在由于疫情而导致封锁的前三周内,该公司远程管理门户(服务交付平台或SDP)的登录量增长了30%,而用户在该系统上花费的时间增加了一倍。
  虽然允许工作人员进入数据中心,但是需要相互远离,并且发现数据中心仍然可以在更少的人为干预下运行,因此我发现了远程管理的更多价值。Bensten说:“冠状疫情加快了远程管理平台和工具的应用,因此可以远程完成以前在现场完成的工作。”
  熄灯运营是为了解决技能短缺问题?
  在许多情况下,“熄灯”是降低数据中心技能要求的一种方式,既可以作为一种削减成本的措施,也可以作为解决难以寻求熟练员工问题的一种方式。
  施耐德电气公司的工程师Steven Carlini在一篇博客文章中对“为什么将来每个数据中心都将成为熄灯数据中心”进行了解释。他在这篇文章指出,企业应该尽可能让其内部部署数据中心实现熄灯,其中一个原因是为了应对疫情的封锁,另一个原因是解决技能短缺问题。
  Carlini说:“熄灯和无人值守的说法可能并不完全准确,因为安全人员很可能会在现场工作。”他建议数据中心应该雇用具有机械技能的安全人员,并让他们实施即插即用的硬件更换工作,有些公司已经在尝试使用Zoom视频软件指导人员进行维护和维修。
  在很多情况下,熄灯数据中心的概念已经演变为数据中心不需要更多技能的概念。
  水下数据中心的探索
  那么,熄灯数据中心真的存在和可行吗?也许有一些数据中心以这种方式运行,也许是一些公司对此进行保密,也许已经失败(例如AOL公司的ATC数据中心)。
  但是行业人士确实了解一个知名案例。微软公司试点部署的一个水下数据中心已经运营了两年,该数据中心的电力容量为240kW,并且不用工作人员现场访问和维护,这是因为这个数据中心沉在海底。
  微软公司的一个名为Project Natick的研究团队在2018年将12个服务器机架部署在一个压力容器中,并将其沉入苏格兰海岸附近的海底。两年来,这个水下数据中心的服务器的运行没有受到任何影响,与它们的唯一通信是通过电力和网络电缆进行的。该数据中心运行了864台服务器和27.6 PB的存储设备,主要处理来自Azure云平台的工作负载。这个无人值守的数据中心部署在充满了非活性氮气的密封罐体中。
  微软公司最终在2020年从海底打捞出这个名为“SSDC-002”的水下数据中心。Project Natick水下数据中心主管David Cutler说:“这个水下数据中心无人运营长达25个月零八天,其运营结果令人满意。”
  可靠性和摩尔定律
  水下数据中心服务器的可靠性与传统数据中心的同类服务器相比高出大约七倍。Project Natick水下数据中心使用的是一批二手服务器,并将其中135台的服务器在陆基传统数据中心中运行,其余的855台服务器部署在这个水下数据中心。
  Cutler说:“在135台陆地服务器中,有8台服务器在两年内发生了宕机。而在水下数据中心的855台服务器中,只有6台服务器发生宕机。这些服务器都执行相同的任务,并且没有进行任何维护,但是传统数据中心的振动和氧气环境导致其可靠性相对不高。”
  行业人士反对运营熄灯数据中心的主要意见是,需要定期更换服务器和存储设备,这并不是因为服务器和存储设备的硬件损耗,而是因为它们已经过时。几十年来,IT硬件遵循摩尔定律(硬件性能随着技术进步每18个月翻一番),采用新服务器仅在使用能源成本方面就可以在三年内收回投资。
  芯片工艺现在已经接近极限,摩尔定律也即将终结,而服务器的使用寿命将更长。Uptime Institute研究总监Rabih Bashroush说,“在更换使用寿命长达9年的服务器时,仍然有非常充分的理由节约能源。”
  Cutler预测,这将使数据中心运营商更加关注熄灯数据中心的部署和运营。他说,“在数据中心的整个生命周期中,服务器的成本占很大比例。在后摩尔定律时代,没有理由每两年更换一次IT设备。”
  在边缘采用熄灯数据中心
  尽管传统数据中心仍然需要运营人员进行管理,但新的应用场景和边缘计算领域将可能需要运营熄灯数据中心。
  物联网等新技术发展以及更多采用流媒体和远程工作应用程序,导致数据中心用户对高度分散的低延迟资源的需求。这意味着需要靠近人员和数据源部署大量小型数据中心设施。大多数的边缘数据中心规模比微软公司Project Natick的水下数据中心要小得多,有些甚至在灯柱上安装。除非能够完全消除现场访问和运营,否则边缘数据中心在维护成本方面难以承受。
  Cutler说:“就像我们所做的那样,通常会采用熄灯数据中心。边缘计算设施最终只能独立运行。”
  当AOL公司技术副总裁Mike ManosMike Manos提出这一想法时,实际上是在谈论边缘计算设施,旨在使AOL公司的服务更贴近客户。
  Cutler表示,随着技术的进步和发展,熄灯数据中心的发展可能比人们想象的还要快,将会成为数据中心行业的一种趋势。
  文章来源:51CTO
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业