行业资讯

Uptime:数据中心故障率正在降低

2024-04-13发布 61次浏览

近日,Uptime Institute发布了最新的《Annual Outage Analysis 2024》报告。报告指出,尽管媒体对数据中心停机事件的关注度增加,但整体而言,数据中心的停机频率和严重性实际上正在下降。这一发现对于数据中心的运营商和所有者来说无疑是一个积极信号,表明行业正在朝着更加稳定和可靠的方向发展。

《Annual Outage Analysis 2024》通过对数据中心管理者的多项调查、会员报告以及公开可用的报告进行综合分析,提供了关于数据中心故障现象的全面视角。调查结果显示,在2023年Uptime Institute数据中心调查中,超过一半(55%)的运营商受访者表示,在过去三年中曾发生过停机,低于2022年的60%和2021年的69%。与此同时,2023年只有十分之一的故障被归类为严重或者很严重,比2022年降低4个百分点,比2021年降低10个百分点。

虽然故障率在降低,但调查结果也表明每次故障都是有成本的。超过一半的受访者表示他们最近的一次重大、严重或极端的停机事件成本超过100,000美元,而16%的受访者表示成本超过1百万美元。

报告显示,在故障原因方面,电力问题仍然是数据中心停机的最主要原因。紧随其后的是冷却系统故障。

此外,虽然网络故障率只排在了第五位,但却是更严重的一个问题。IT系统与硬件故障往往只是影响特定的服务,但网络故障经常会导致数据中心服务中断,影响更大。尤其在云服务和第三方服务提供商日益增多的背景下,网络稳定与安全的重要性更应该受到重视。

报告还探讨了影响数据中心稳定性的多种趋势和因素。例如,随着公共云的采用增加,数据中心可能不再直接记录某些停机事件,而是将“第三方供应商”作为更多IT服务中断的原因。此外,COVID-19大流行对数据中心行业产生了深远影响,包括需求的减少和增加、供应链的压力以及扭曲的停机率。这些影响在2024年仍然可以感受到,尽管它们的长期影响尚不明确。

气候变化和极端天气事件也是导致数据中心停机的风险因素之一。随着全球向更多交易性、动态性和可再生能源电网的转变,电网的可靠性可能会降低,这可能会导致数据中心停机事件的增加。

Uptime Institute的报告建议数据中心运营商和所有者继续投资于物理基础设施的冗余性,以减少停机事件的发生。调研也表明,各类型的数据中心的冗余设施在过去一年中都有一定程度的增加。

报告还建议行业也需要关注新技术的采用,如分布式软件基础的弹性和液态冷却技术,这些技术可能会带来新的挑战和风险。数据中心行业需要继续关注和适应变化,以确保数字基础设施的稳定性和可靠性。通过持续的技术创新、最佳实践的实施和对新兴趋势的敏感性,数据中心运营商可以更好地准备应对未来的挑战,确保业务连续性和数据安全。

来源:中国IDC圈。