数据中心网络的未来发展趋势 自动化是关键
发布于2022-05-27
许多研究预测到2030年,美国境内的数据中心将消耗近3000太千瓦时 (TWh) 的电力。在未来几年,不断上涨的电价,加上数据中心的高耗电量,将导致各种严重的环境问题。数据中心管理能效的改进将成为人类社会实现可持续发展的关键。采用机器人也许能让这一问题得到很好的解决。
今天,在COVID-19首次爆发两年后,招工难成为了企业所面临的一大难题。这就是机器人未来的可能应用场景——它不是为了取代人类,而是为了增强人类的能力。这将使人类能够为其他重要任务带来更多价值。
数据中心机器人的发展
当前状态
超大规模数据中心要远远大于标准数据中心,占据巨大的空间(至少930平方米),包含5000多台运行在超高速、高光纤网络上的服务器。
数据中心的工作人员需要执行大量工作,如检查服务器标签、室温、地下冷却液管道等。机器人将很快接管其中大部分工作。
例如,Novva数据中心在其犹他州数据中心部署了波士顿动力公司的机器狗,以执行设施监控任务,如监控设施设备,以确保峰值效率和适当的温度。
许多公司现在正计划在数据中心部署更先进的机器人系统。这项工作最终需要人工智能的支持,而不需要人工干预。
当数据中心机器人的缓慢崛起
与机器人和人工智能 (AI) 不同,人类具有很强的适应性。机器人还无法很好地应对突然的变化,也不能像我们人类那样有效地进行学习和提升。距离机器人取代人类在数据中心的位置还需要几年的时间, 但可能不会太久。
数据中心管理自动化的新兴趋势
当我们探索物理和虚拟环境中跨计算、网络和存储层的自动化IT流程时,很明显,数据中心管理自动化为用户提供了快速行动和达成目标所需的灵活性。
智能监控系统
使用物联网 (IoT) 和传感设备可以为关键任务数据中心设施收集数据。在这里,可以实时收集和共享位置、电源、资源利用率、温度、湿度等信息。
谷歌已在使用机器学习 (ML) 来提高数据中心的效率,降低冷却消耗,并减少排放。该公司的ML算法将用于冷却的能源水平降低了40%,达到了有史以来最低的电力使用效率 (PUE) 指标。该行业采用这一标准来衡量数据中心的效率。PUE 2.0意味着IT设备每消耗1瓦特的电量,就需要额外再消耗1瓦特的电量对它进行配电和冷却。
ML在数据中心的实际应用
数据中心中用到ML算法的一个简单例子就是对数据中心至关重要的空调,即将温度设置为特定水平并进行监控。环境系统将响应数据中心的温度变化,并将温度保持在最佳设定水平。AI和ML将使用这些数据来识别、分析和处理编程指令。
人工智能还负责能源效率、电源管理、成本降低、准确性、消除人机界面,并通过机器学习和人工智能满足所有任务。
模拟工具与人工智能和数字孪生之间的关联
数字孪生是一种高度复杂的数字表示,以虚拟的形式模拟现实世界中的对象、过程或系统,并通过测量数据(如功率、温度、压力、振动等)进行关联。数据中心的数字孪生是真实世界数据中心的3D模拟复制品(图1),用于分析数据中心的当前环境,进而通过反馈回路建议改善特定参数的控制措施。数字孪生通常由集成到数据中心实际控制中的数字设计工具组成。
图1:数据中心的数字孪生是真实世界数据中心的3D模拟复制品。(图源:Jackie Niam/Stock.Adobe.com)
数字孪生和人工智能等数字化理念和新技术将使工业企业能够以前所未有的速度、效率、质量和灵活性发展。
机器人
机器人将取代固定传感设备,使移动技术能够更好地实现流程和/或重复任务自动化。机器人还将负责实现特定功能或重复任务的自动化。这些智能机器可以执行通常由工人执行的任务,从而提高流程自动化、生产率,并减少人为错误。
数据中心机器人技术需要万无一失,从下面这段对话中便可见一斑:
史蒂夫:“哈尔,请检查数据中心的环境条件。”
哈尔:“对不起,史蒂夫,恐怕我做不到。”
数据中心机器人的其中一个任务就是资产跟踪自动化。具有视觉功能的移动机器人几乎不需要人类就能读取LED指示灯。机器人监控并记录测量结果,然后通过网络界面共享。
在数据中心中,人类与机器人之间建立了无线通信连接。这些机器人通过应答器来找到准确的位置,并以低延迟、沿着有效路径移动。它们还拥有激光测距传感器和内部运动装置,以便能够在实际数据中心空间移动。机器人可以在避开静止和移动障碍物的同时找到最佳运动轨迹。
自主机器人的另一个应用是为了数据中心的安全,因为数据中心无法实现全天候(一年365天24X7)有人值守。这些机器人配备了多种传感设备、昼夜摄像头,并通过人工智能进行了增强, 其中包括防碰撞、发热检测技术和面部识别功能。通过技术的加持,机器人可以与人类通信,监控车牌,观察检测是否异常,还具有可使用自动门和电梯的导航功能。
基于机器人技术的数据中心电子监控解决方案
云计算
用于在数据中心执行环境监测的云机器人 (CR) 平台将实现对网络、服务器、存储、服务和应用程序等的便捷和按需网络访问。
机器人操作系统 (ROS)
这是一个允许开发机器人软件的开源ROS。这个开源系统将提供一整套工具来帮助解决常见的机器人开发问题,如路径规划、碰撞检测、图像处理、探索、对象识别、手臂运动规划、仿真和机器学习 (ML)。
云机器人管理员
云机器人技术被定义为机器人技术和云计算的结合(图2)。这种结合让机器人能够享受到现代数据中心强大的计算、存储和通信资源。
图2:云机器人。(图源:基于机器人技术的数据中心电子监控解决方案,2019年)
同时定位和映射 (SLAM)
由于机器人会维护位置信息,因此SLAM对于在未知环境中更新和构建地图非常有用。使用这种方法,每个被动光纤连接都可以被安全地锁定,延迟较少,并且不受数据速率或协议的影响。
机器人光纤交换机
带有软件的免人工自动化操作可以通过机器人光纤交换来部署,以进行物理网络连接。现在已经有了机器人光学交换机,它可以交错编织大型交叉连接结构,同时具有低插入损耗和坚固的连接。
由于机器人光学交换机采用矩阵设计,因此该方法可以使用交叉交换消除缠结光纤。测试和恢复可以通过机器人光纤交换机轻松实现自动化。
采用机器人和机器学习的下一代数据中心网络
深度学习教授机器人操作目的
深度学习在机器学习领域已经有30多年的历史了。教授机器人进行机器学习时,工程师和科学家们可以决定人工智能的学习方法。领域专家的下一个任务是为机器人在数据中心任务范围内工作和操作提供建议。深度学习侧重于机器人需要从根本上进行专业化的领域。
下一代数据中心网络 (DCN) 将极大地挑战机器人在数据中心的性能。新的DCN将需要支持云计算、大数据、物联网、虚拟化,最重要的是,需要提供可扩展性,以充分应对高峰时间,确保通信畅通。网络拓扑结构将更加复杂,因此处理管理过程的人类操作员将发现他们的工作既乏味又单调, 而且仅通过人工操作无法实现数据中心的全面性能;现在有了机器人的加入情况已得到了改善,未来机器人还将发挥更重要的作用。人工智能和机器学习将在管理这些过程的复杂性方面发挥重要作用。
以NASA的机器人联盟项目为例。有人预测,由于NASA将重返月球,并最终前往火星,这一目标以及其他机器人公司的持续努力会促进先进机器人技术的诞生。美国国家航空航天局只是众多大胆尝试的机构之一。想想埃隆·马斯克的计划和突破,以及他在2024年登月的雄心勃勃的计划。数据中心机器人专家可以从这些新技术中学习,以改善未来所有行业的机器人技术。
数据中心的机器学习 (ML) 和人工智能 (AI)
通过机器学习对机器人进行训练需要工程师和科学家的帮助,他们还将决定人工智能的学习方式。领域专家的下一个任务是为机器人在任何任务范围内的功能和操作提供建议。他们还需要详细说明机器人作为后勤专家和安全顾问的特点。深度学习侧重于机器人需要从根本上进行专业化的领域。
未来的DCN将需要支持智能互联设备、多租户应用和服务所需流量的大幅增长,并具有满足需求的超强功能。这些任务现在或将来都将由机器人来执行。
本部分介绍了感知的一个广泛分支,展示了拟议的ML解决方案在支持数据中心网络操作和机器人管理方面的适用性, 包括工作量预测、流量控制和优化、拓扑管理、网络状态预测、故障分析和安全性。
基于ML的解决方案面临许多挑战;因此,还需要进行更多的研究,以及重新构建解决方案,方能打造出下一代更智能的、由机器人辅助的数据中心网络。
结语
事实上,自动化是管理未来数据中心网络的关键。如今,面向未来更复杂数据中心的机器人技术正在快速发展,而机器人设计师也在发挥着其令人难以置信的创造力。电动汽车制造和仓库自动化行业发展迅速, 然而,却缺乏坚实的生态系统来支持基础设施端的机器人技术。
作者简介
Steve Taranovich是纪实著作《真理守护者》(Guardians of the Right stuff) 的作者,这是由NASA和Grumman公司的多位工程师、一位航天员以及多位技术人员讲述的有关阿波罗计划的真实故事。Steve曾在2012年至2019年期间担任EETimes/Planet Analog的资深主编以及EDN的高级技术编辑,并负责模拟和电源管理设计中心的运作。他在电子电路设计和应用领域拥有40年的从业经验,并且在工业领域拥有9年的技术写作和编辑经验。他的专长涵盖模拟电子、空间相关电子、音频、射频与通信、电源管理、电气工程和集成电路 (IC)。Steve Taranovich是一位实力雄厚的媒体和通信专家,1972年获得纽约大学工程系电子电气工程学士学位,1989年获得纽约理工大学电气工程硕士学位。他曾于1972年到1988年间担任过8年的音频电路设计工程师和8年的微波电路设计工程师。