您现在的位置:首页 > 数据中心要更加关注运营可靠性

数据中心要更加关注运营可靠性

来源:网络 日期:2018-09-07 点击:0
今年,31%的受访者表示他们在过去一年中遇到了停机事件或严重的服务质量下降,高于去年调查中的25%。数据中心内部电源故障、网络故障以及软件或IT系统错误是最常见的主要原因,近80%的受访者表示可能已经阻止了最近的中断。大多数中断的完全恢复时间为一到四个小时,超过三分之一的恢复时间为五小时或更长时间。
企业对可靠的数字基础设施的需求日益增长,因为数字经济如此依赖它,并且每天都变得越来越多,停电对企业造成了更大的影响,并付出了更多的代价。因此数据中心行业需要改进,可以采用全球通用标准设计、建造和运营数据中心来做到这一点。
 
日前,全球知名的数据中心设施咨询机构Uptime Institute发布的全球数据中心调查报告提供了数据中心业务的内部视图。该调查于今年早些时候开展,收集了近900家数据中心运营商和与企业和服务提供商数据中心设施相关的IT从业者的反馈。
 
开展这个调查的Uptime Institute公司是一家总部位于西雅图的组织,专注于数据中心各方面设施的运营,也是全球众所周知的数据中心“Tier标准”及其相关认证的创建者。
 
2018年的调查结果表明与以往的报告相同,主要是一些积极的指标,但有一些领域面临风险,可能需要改善。
 
Uptime Institute公司执行董事Lee Kirby表示,“如果我进行一下总结,我认为企业对可靠的数字基础设施的需求日益增长,因为数字经济如此依赖它,并且每天都变得越来越多,停电对企业造成了更大的影响,并付出了更多的代价。因此数据中心行业需要改进,可以采用全球通用标准设计、建造和运营数据中心来做到这一点。”
 
他指出,数据中心业务中断或停电可能是最令人担忧的风险。今年,31%的受访者表示他们在过去一年中遇到了停机事件或严重的服务质量下降,高于去年调查中的25%。数据中心内部电源故障、网络故障以及软件或IT系统错误是最常见的主要原因,近80%的受访者表示可能已经阻止了最近的中断。大多数中断的完全恢复时间为一到四个小时,超过三分之一的恢复时间为五小时或更长时间。
 
考虑到与停机相关的巨大费用,以及数据中心采取的主动方法来保持“9个9”的可靠性,这是一个令人惊讶的结果。Kirby表示,这样的结果可能集中在数据中心日益复杂化,因为IT部门在边缘增加了资源。
 
他说,“我认为随着采用率的提高,以及物联网的使用和所有设备的部署,企业对数字基础设施的的投资将会加大,这将对经济产生影响。因为通信行业发生变化也会影响整个市场。不同的企业会受到影响。”
 
在很多方面,数据中心的安全运营似乎是问题的关键所在。68%的受访者采用了传统方法,试图保证从灾难性故障中快速恢复,定期备份到辅助站点,51%的受访者表示实时将数据复制到辅助数据中心(40%的受访者表示已复制到两个或更多数据中心)。其升级的方法也越来越受欢迎。42%的的受访者表示他们将某种灾难恢复作为一个服务计划,36%的人利用基于云计算的高可用性服务。
 
随着停机时间的增加,许多数据中心运营商都没有更多关注气候变化可能对其数据中心设施造成的影响。根据调查,45%的受访者表示他们的组织此时并未适应气候变化影响。
 
Kirby说,“这对我来说很惊讶,气候变化对数据中心的运营产生的影响越来越大,我认为这意味着数据中心行业需要更加勤勉地规划灾难恢复。不仅要在基础设施层面进行研究,还要进行全面的业务恢复计划,并解决数据中心不能正常运行的情况。”
 
尽管存在这些负面影响,但大多数调查显示数据中心运营商在许多关键领域都处于领先地位。例如,冷却成本占数据中心总功率支出成本的比例继续提高。根据调查结果,2018年数据中心的的平均能源使用效率(PUE)值始终处于1.58的历史最低点(越低越好)。该调查报告指出,Uptime Institute在2007年进行的另一项调查中,能源使用效率(PUE)为2.5,到2013年已降至1.65。从那时起,PUE值的降幅逐渐增加。
 
Uptime Institute在报告中指出,“近年前,最重要的是基础设施效率得到大幅提升。而进一步改进将需要大量投资和努力,其回报越来越低。组织将继续提高效率,以降低运营成本或最大化可用功率(或二者兼而有之),包括人工智能驱动的数据中心管理即服务(DMaaS),软件定义电源和其他方法。”
 
数据中心机架的功率密度也在上升。当被问及最高的现场服务器密度时,调查报告表明,一半的受访者表示,其每个机架功率为10 kW到29 kW之间,而19%的受访者表示其机架功率密度为30 kW或更高。
 
然而,最高的机架功率密度远远低于平均值。在去年的调查中,67%的受访者表示平均每个机架功率低于6千瓦,只有9%的受访者表示每机架为10千瓦或更高。报告中没有包括当前平均机架功率密度的数据。
 
增加计算密度并提升速度就是采用冷却设施。虽然只有30%的受访者表示仍然依赖于传统机房空调,56%的受访者表示他们依赖精密空调进行冷却,但只有14%的受访者表示使用液体冷却,这可以实现最高的服务器功率密度。大多数受访者表示,他们使用精密空调解决方案冷却IT设备。
 
报告指出,在必要时需要进行改变,因为针对人工智能(AI)工作负载优化的服务器硬件具有比标准x86服务器高得多的电源和冷却要求。
 
“虽然高功率密度的IT环境可能仅限于人工智能应用和高性能计算(包括具有高I/O的游戏和物联网应用)的运营商,但是为这些类型的客户提供服务的一些主机托管数据中心提供商也需要适应。”报告说,“配备精密空调或液体冷却的预制模块化数据中心组件越来越多地被视为实现混合数据中心环境的改进策略。”
 
调查中涉及的其他项目是数据中心信息管理(DCIM)软件(已成为市场主流),人员配备(寻找熟练工作人员将变得更加困难)。与后者相关的是多样性和男女性别平等的主题。根据这份报告,在大多数数据中心,女性员工占劳动力的比例不到6%,70%的受访者认为这并不是什么问题。
 
Kirby 表示,“经过研究表明,缺乏多样性通常不仅代表缺乏招聘渠道,还存在技术停滞、负面宣传以及最终市场份额流失的威胁。”
 
报告指出,“数据中心行业领导者和其他企业越来越多地认为,未来数据中心业务的成功将取决于建立多元化的员工队伍。”
 
Kirby对于今年的调查进行了总结。他说,“边缘计算正在改变数据中心运营和管理的动态,我们推出了一项名为TIER-Ready的计划,该计划正在帮助组织确保他们的基础设施在边缘更加可靠,因为边缘设备将用于多种用途。边缘数据中心将与核心数据中心不同,因此人们需要在边缘设备运行分布式数据中心的实践和程序。”

关键词:数据中心,服务器,停电,断电
数据中心要更加关注运营可靠性为中国U网原创文章,在不经过允许的情况下,禁止用于商业用途或随意转载,转载请注明出处,并加上本页链接地址:
http://www.cuwww.com/news/detail-287.html
版权所有 中国U网 侵权必究 免责声明 互联网不良信息举报
旺旺:点击这里给我发消息
售前:cuwww
售前:cuwww
售后:cuwww
技术:cuwww