人工智能时代,如何避免数据中心停机
新型保险丝设计提升设备运行时间
发布于2025-05-08
人工智能 (AI) 的快速发展导致了数据的爆炸性增长。事实上,过去三年产生的数据量超过了人类历史上的总和。[1]因此,数据中心企业和云服务提供商 (CSP) 正在全球范围内大规模投资新建数据中心基础设施。仅在北美地区,数据中心建设规模同比激增70%,达到创纪录的3.9吉瓦。[2]
要应对这一增长,仅复制现有的数据中心是不够的 此外,为了处理AI工作负载,数据中心的规模也在不断扩大。十年前,30兆瓦的设施被认为是大型数据中心,而如今的数据中心经常超过200兆瓦。[3]其复杂性也在不断增加。如今的数据中心不再是排列整齐的标准服务器机架,而是需要复杂的硬件组合,包括图形处理单元 (GPU)、现场可编程门阵列 (FPGA) 及处理AI工作负载的其他专用硬件。
然而,建设现代化数据中心设施面临着诸多挑战,包括能源供应、网络连接的地理位置、气候条件变化及政府法规等。虽然新建数据中心需要数年时间,但一旦投入运营,便不能停机。数据中心停机一小时都可能导致重大财务损失,潜在损失可能达到数百万美元,因此即使是看似微小的维护问题也可能带来巨大的财务影响。[4]尽管数据中心停机率呈下降趋势,但停机成本仍在持续上升。[5]
传统控制柜设计中的隐性成本
在数据中心不间断运行时,用于电力分配、供暖、通风与空调(HVAC)基础设施、服务器机架、通信系统及整体建筑管理的控制柜至关重要。然而,传统控制柜设计存在固有缺陷,既影响施工效率,又会对日常运营造成负面影响。
由于需要铺设大量定制线缆和连接器,这种部署需求在技术人才短缺的环境下会进一步延长施工周期并推高劳动力成本。每个控制柜都需要手动布线,不仅耗时,还会使柜内敏感设备暴露于灰尘等危害环境中。随着时间的推移,这一挑战可能会导致整个设施的持续维护难题。
此外,空间也是一个问题。保险丝端子块等组件占用了控制柜内宝贵的空间,限制了设计灵活性,致使控制柜在空间紧缺的环境下占用更大的面积。
更关键的是,传统控制柜设计会使简单的维护任务变得复杂化。以保险丝损坏为例,这可能导致系统停机数周,因为专业电工可能需要几天时间才能达到现场, 而且到达后,他们可能需要检查多个机柜才能定位故障,而每个机柜内都包含大量保险丝。考虑到大型数据中心可能包含数千个保险丝,这绝非小问题。而数据中心每停机一小时、一天或一周,都意味着数百万美元的损失。
通过智能保险丝改变维护方式
面对数据中心持续不断的挑战,HARTING Han® Protect提供了一种简单的解决方案(图1)。Han Protect不仅消除了带保险丝的端子块,还使设计师能够轻松识别熔断的保险丝,无需工具,即可从控制柜外部轻松快速地进行更换。
图 1:HARTING Han® Protect 3A型重载电源连接器 (图源:贸泽电子)
通过将保险丝系统移至机柜外部(同时保持保护功能),Han Protect改变了数据中心的构建和维护方式(图2)。
-
快速更换保险丝:最显著的优势是大幅减少了维护时间。保险丝熔断不再意味着数小时或数天的停机。非电工技术人员可在数分钟内完成保险丝更换,且无需专业电气知识。集成LED指示灯可精确显示熔断的保险丝位置,节省时间并防止因长时间停机导致的收入损失。
-
提升安全性:通常,访问保险丝需要打开控制柜, 这种情况存在暴露敏感设备或意外断开连接的风险。Han Protect通过提供外部保险丝访问通道,同时保持关键系统安全,解决了这一问题。这种设计能在常规维护期间维持控制柜安全,对于处理敏感数据和关键任务操作的设施至关重要。
-
空间优化与可持续性:保险丝的布局设计减少了控制柜的整体尺寸。通过移除内部保险丝端子块并重新组织组件,可实现更紧凑的柜体布局。这种效率不仅直接提升了设施密度,还通过减少材料使用支持环境可持续性目标。[6]
-
主动维护:带LED指示灯的外部保险丝将基本电路保护升级为健康监测系统。传统保险丝端子块隐藏在机柜内部,容易忽视非关键故障,而外部保险丝则使系统健康状态一目了然。这一简单改动可帮助维护团队在问题升级为严重故障前及时发现并解决潜在隐患。
图2:Harting HAN Protect优势概述 (图源:Harting;由贸泽电子修改)[7]
应对未来数据中心挑战
随着人工智能和数字化转型推动数据中心发展迈向新高度,Han Protect等解决方案展现了满足日益增长的效率、可靠性和可持续性需求所需的前瞻性设计理念。这种方法通过解决建设周期、维护流程和空间利用等多重挑战,帮助数据中心应对日益数字化的世界带来的压力
数据中心基础设施的未来取决于能够平衡安全、访问性和效率之间竞争需求的解决方案。随着数据持续呈指数级增长,人工智能应用日益深入关键运营流程,维护和保护这些关键设施的能力将愈发重要。能够简化维护流程、增强安全性并减少占地面积的创新技术,无论是现在还是未来,都在数据中心设计中扮演着至关重要的角色。
参考资料
https://www.blackstone.com/insights/article/the-convergence-of-data-centers-and-power-a-generational-investment-opportunity-the-connection[2]https://www.reuters.com/markets/us/north-america-sees-70-jump-data-center-supply-construction-cbre-report-says-2024-08-20/
[3]https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/ai-power-expanding-data-center-capacity-to-meet-growing-demand
[4]https://www.ciodive.com/news/IT-outage-cost-report-new-relic/696359/
[5]https://www.itpro.com/infrastructure/data-centres/why-major-data-center-outages-may-soon-be-a-thing-of-the-past
[6]https://www.harting.com/en-US/transforming-data-center-case-study
[7]https://www.harting.com/en-US/han-protect-fuse-integrated-connector
作者简介
Brandon是一位有超过十年经验的深度技术记者、讲述者和技术作家,从软件初创公司到半导体巨头都是他曾经报道过的对象。他关注的领域包括嵌入式处理器、硬件、软件和工具,因为它们都与电子系统集成、物联网/工业4.0部署和边缘人工智能等用例有关。他还是一名出色的播客、视频博主、活动主持人和会议发言人,并曾在多家电子工程贸易出版物中担任主编和技术编辑。
Brandon在不出席面向B2B技术受众的大型活动时,会通过电视指导菲尼克斯地区的体育特许经营公司。