您当前的位置是:  首页 > 新闻 > 国内 >
 首页 > 新闻 > 国内 >

十问数据中心#2:人人聊,家家说,AI在数据中心真的落地了吗?

2019-03-11 10:04:18   作者:   来源:CTI论坛   评论:0  点击:


  数据中心如今伴着云计算、大数据和5G的兴起迅速站稳C位,大伙儿众说纷纭,展望得心潮澎湃。但这些展望靠不靠谱?又如何落地?好的数据中心到底长啥样?怎么建设,又该如何管理?
  不能懵,华为现在带你一起,十问数据中心!
  人人聊,家家说,AI在数据中心真的落地了吗?
  自从AlphaGo战胜了柯洁和李世石,如果一个科技圈或创业圈的精英不会聊两句AI,出门儿都不好意思跟人打招呼。无比敬岗爱岗的数据中心从业者们当然也不能放着这么好的技术不琢磨,不过关于AI与数据中心,说了不少,也听了很多。但新技术只有应用,创造出价值,才有继续优化和演进的可能。
  问:所以现在AI在数据中心真的落地了吗,应用了有什么好处?
  答:落地了,实践证明,AI是数据中心难得的行业转折机遇,AI将使能数据基础设施价值最大化。
  问:那怎么用AI实现价值最大化呢?
  答:以下有几个经过验证的标准答案,要不借你“Ctrl C”一下。
  1、让AI时时给数据中心做CT
  主动预防,安全可靠
  安全运行对数据中心的重要性不言而喻,业界在提升数据中心可靠性和可用性方面已有实践,例如收集供配电系统设备信息,对即将发生故障的设备和部件提前发出预警,为运维人员的运维活动提供决策支撑,但是如何利用机器的自我学习能力,做到供配电系统整体运行的安全可靠,是需要思考的重点问题。要实现更高程度的智能化及主动避错,这对AI技术应用是个很好的契机。
  华为融入AI性能的iPower技术可提升数据中心可用性,借助智能化硬件,实现智能故障定位与预警管理,引入大数据技术,智能分析每日海量的运维数据,识别机房潜在隐患,保障数据中心的可靠运行。
  iPower智能供配电技术以模块化UPS为核心,主要通过供电全链路监测、预警和故障自动隔离等手段,提高数据中心能源基础设施可用性,继而通过AI技术的应用,最终实现预测性维护。
  iPower通过供电全链路监测,可实现毫秒级的故障检测,毫秒级的故障隔离,分钟级的故障恢复,可消除火灾隐患,大大提高数据中心能源基础设施可靠性和可用性;
  以电池管理为例,在预防电池失效方面,iPower通过AI技术,可以精确预测电池的寿命和健康度,为用户提前提供维护决策依据,及时排除有失效隐患的电池组,变事后补救为事前预防,变被动响应为主动维护,大大提高数据中心供配电安全等级。华为的模块化UPS结合iPower技术,可以在电池出现温度快速升高等极端情况下,自动切断该组电池,从而避免出现起火等恶性事件。
  2、让AI给数据中心做管家
  智能营维,自动高效
  数据中心传统的维护方法是靠人,失误率大、漏错率高、失效排查时间长,传统运维方式无法解决人为误操作带来的业务中断问题。
  融入AI性能的 iManager,可看作是数据中心的大脑,借助智能化硬件和传感器,实现精准感知。通过自动化手段,逐步减少人工巡检等例行重复性工作,池化专家资源和能力,并固化于运维流程中。
  加上全流程的电子运维,包括巡检、维保、应急演练,把所有的流程以及操作指导全部做到线上,实现了运维质量从原来靠人的责任心到现在靠流程管理的转变。通过全流程电子化的运维跟踪,量化原来无法量化的信息,比如通过电子运维提升巡检的执行力和运维活动的质量、实现故障的预测等,大幅提高人均运维效率和运维水平,提升数据中心的可靠性。
  此外,市场上出现了越来越多由边缘计算产生的边缘数据中心机房,就近提供服务和处理计算。边缘数据中心数量日益增长,分行、支行、网点等数据中心无法统一集中管理,数据中心故障响应速度慢,运维效率低。
  华为iManager全网管理功能,实现对多网点数据中心基础设施进行集中监控,统一管理,实现预防性维护,通过GIS定位技术提高故障定位响应速度,提升数据中心运维效率;移动APP监控,从内到外简化管理,轻松知晓海量网点数据中心运行情况,摆脱传统人工的运维检修方式,降低维护下站次数和节省开支,让数据中心管理变得更加简单、高效。
  华为iManager还能对资产进行盘查,保证设备的完整性,保护重要数据。另外,还可以对资产匹配最适宜的供电、制冷、空间、带宽等资源,实现资源的最佳利用,利用AI技术,可协助对资产上下架和运营进行智能化的管理,提升运营效率和效益。
  3、AI给数据中心唱首“凉凉”
  降耗增效,绿色节能
  能耗问题一直是数据中心关注的焦点,传统数据中心年平均PUE高于1.8,随着越来越多AI应用的落地,业界对高速计算的需求日渐增多,GPU计算服务器的规模和需求将持续增长,加速计算服务器产生的热能是传统CPU的数倍,如何解决服务器的散热问题将是未来的重要考量。目前已有的智能DC节能技术可以通过传感器获取关键节点数据,进而优化所有系统和设备的整体能耗,降低PUE。
  而AI能否深入数据中心内核,带来更低PUE?华为作为ICT行业的领导者,在数据中心热管理技术方面走在行业前端,致力于带给客户更低的PUE。
  华为将基于AI的iCooling智能热管理解决方案融入数据中心基础设施,针对数据中心制冷效率提升瓶颈,通过深度学习,打通精密空调末端、冷水机组、冷却塔、水泵等制冷系统以及IT负载、环境变量等大数据之间的联动,对大量的历史数据进行分析,探索影响能耗的关键因素,获取PUE的预测模型。利用寻优算法,获取调优参数组,下发到控制系统,实现制冷系统的最优控制。最终通过规范化的实践引导和目标导向评测,不断调整优化,获取最佳PUE。
  iCooling@AI解决方案目前已在华为云廊坊数据中心成功部署,全年PUE可降低超过0.1,年平均值达到1.3以下,年节约电费数百万元。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业