根据IDC的数据,在数据中心管理者所关注的问题中,存放和运行服务器所需要的计算机支持基础设施建设的重要性仅次于系统价格。IDC负责高性能计算的副总裁Steve Conway曾如此表示,“在3到4年以前,这些问题的重要性在人们的心目中要排到第12的位置,当时并不被人们认为是个问题。”
优先级的变化带来的问题
这种优先级的变化体现了技术的更新换代和在处理能力需求上的剧增。虚拟化和多核处理器技术正在让我们在更小的空间内实现更强大的处理能力。随着各种类型企业的核心业务过程对联网计算机的依赖程度的增加,企业在不断地将更多服务器放到它们的现有数据中心中。Gartner预计,到明年,世界上的数据中心有一半的基础设施将不能满足最近的高密度设备的电力和散热的需求。
这种改变给大型数据中心的管理者带来一个问题,这也是高端技术的超级计算中心的管理者数十年来一直在解决的问题:如何合适地搭建数据中心的基础支持设备,优化高密度服务器机架的散热问题,针对业务需要均衡数据中心效率和跟踪那些可以推动或破坏数据中心运行的细节问题。
设计一个新的数据中心,或者对一个老的数据中心进行重新设计,都是一个非常复杂的过程,但是根据过去十年的经验,以下六个思路将帮助您朝着正确的方向去开展自己的工作。
①判断你是否真正需要自己的数据中心
建设你的计算机基础设施是一个具有挑战性的过程,而且需要一定的投资。在你决定要搭建自己的数据中心前,先问一下自己,“我真的需要自己的数据中心吗?”
一个最低限度强壮的数据中心起码要包括电力切换设备和发电设备。但是几乎没有人会停留在这个初级层次上。更多的错误冗余设备还包括不间断电源(UPS)的电池或飞轮系统、设备备件,甚至可能还有多个独立的商业化供电线路连接。而且你还需要保护自己的数据中心避免遭受火灾和自然灾害的威胁。一旦数据中心建立后,你还需要有专门的人员来监控和维护它。
正如Amazon的首席技术官Werner Vogels在最近的下一代数据中心大会上所说的,除非你的企业所处的是一个高效、内部数据中心可以直接带来收入的行业,选择将你的应用程序托管在别人的数据中心可能是一个更好的选择。
当然,这个解决方案并不一定适合所有人,但是出于成本的考虑,它无疑是值得你考虑的选择。
②权衡绿色设计的成本和收益
增长的成本和耗能比率正在将电力设计问题推到IT规划探讨的面前。诸如变压器、电力线缆、散热系统和UPS系统,都可能具有比较大的固定电力损耗,也就是说,在你的电能到达第一台服务器前已经被消耗了一小部分。
Green Grid是一个由对提高数据中心能源效率感兴趣的信息技术公司组成的联盟,它推荐通过减少冗余组件来合理精简你的基础设施,只安装那些使你的数据中心正常运行所需要的设备。根据该组织的节能数据中心指导,合理精简基础设施可以节约大约50%的电能。
如此看来,绿色设计确实值得我们考虑。但是它在面对实际情况的时候却又显出其不足之处。
在电力能源依然处于比较紧张的阶段,电网负荷非常高,计划内和计划外的停电事件并非百年一遇。考虑到这个情况,数据中心管理者应该考虑电力冗余问题,其中包括不间断电源或发电机等的增加。
很明显,你需要尽可能设计你的数据中心基础设施的效率。但是至于你可以将你的电力基础设施“绿色设计”到什么程度,要根据你的企业业务的特点来定。举个例子来说,如果你认为增加冗余设备所投入的成本要远远大于数据中心停电可能会给企业带来的损失大的话,你可以考虑采用绿色设计,反之,则要根据情况增加冗余设计,虽然会增加一些固定的电能消耗和设备投资成本,但是这是业务需求不可避免的。
③设计临近耦合散热系统提高灵活性
计算机最拿手的有两件事:计算数字和将电能转化为热能。在数据中心中所消耗的电能中有30%的被转化为服务器中的热量。
散热的传统方法是通过散热设施把服务器的热量散到空气中,再由机房中的制冷空调将其冷却。这种方法实际上使这个屋子充满冷空气,而对于特定的要降温的区域缺乏足够的灵活性。
“临近耦合散热(closely coupled cooling)”的概念在超级计算机中心中已经流行了几年,我们发现效果不错。这种设计的理念是把冷却设备与要降温的设备放得非常近。这种方法可以实现有针对性的降温效果和热区的控制,而且比传统的方法可以更加节省电能。采用“临近耦合冷却(closely coupled cooling)”系统的计算机中心中的机架密度可以比采用传统散热方法的机架高3倍。随着客户需要对服务器机架密度需求的不断提高,所有的主流服务器厂商现在正在提供这种散热方法的设计。
目前已经有许多基于机架和基于芯片的“临近耦合散热”解决方案。例如,把冷空气直接导入到机架中,而不是在整个房间中浪费太多的能源。
另外,基于芯片的液体冷却技术也在不断发展。2005年,Liebert公司收购了Cooligy公司,后者开发的一种方法可以把经过化学处理的水喷到热的部件上面。100多条微通道把冷却剂引到芯片内部特定的发热部位。
美国暖通空调工程师协会内部的工作委员会在去年年底为数据中心里面使用液冷方法发布了指导准则。这个协会的代表来自几家服务器制造商,包括惠普、IBM和Sun。
尽管这些技术对你来说可能还比较陌生,可能还存在这样或那样的担心,但是随着技术的发展,这些忧虑将会逐渐得到消除,因此在设计数据中心的时候,这是一个不能遗忘的部分。
④考虑一下地板瓷砖:小细节大效果
如果你没有计划或不具备条件采用“临近耦合散热”系统,还有一些其他方法来提高你的散热系统的效率。
试一下减少你放在机房的高架地板下的电缆或管道所占用的空间。这个空间是你的制冷空调用来推送冷风到你的计算机的,如果减少这个空间内的障碍物,也可以大大提高散热装置的效率。将地板下的障碍物去掉可以有助于减少数据中心中的热区,并且可以防止空调处理机将能源浪费在另一个地方。
你可以采取的另一个办法是对你的数据中心进行一次流体动力学方面的研究,或者购买一个这方面的软件自己进行这个研究。这种方法使用一个计算机模型来模拟你的数据中心中的空气流动,可以帮助你找出引起散热问题的解决方案,包括选择穿孔大小最合适地板。
几年前,美国国防部超级计算中心采用了这种方法来确信散热装置的效率最大化。通过对数据中心内流体动力学的研究,增大了某些区域地板的穿孔的直径,从而大大提高了散热装置的效率。
⑤将支持设备移到外面
合适的为你的计算机基础设施支持系统选择物理位置,可以让你轻松地在未来对数据中心的容量进行扩展。其中你可以采取的重要的一步就是尽可能将你的电力和冷却设备移到你的数据中心之外。事实上,如果条件允许的话,最好的解决方案就是将这些设备移到数据中心之外的楼上。
有例为证。去年,我们需要一个临时的调整,来获得一个2兆瓦特的额外电源来为国防部计算中心的一个新超级计算机工作,这时候我们发现我们需要增加不间断电源和发电设备,而它们却放不进已经存放了其他电力设施的楼内。这件事不仅仅让我们加大了投资,而且浪费了时间。
我们的新的长期设计将这些设备安排在数据中心建筑物之外的一个新的标准区域之内。可以让我们在未来方便的对数据中心进行扩容。
将这些基础设施移出数据中心建筑物和分布式设计还有其他的好处。在今年初发布的一个报告中,Green Grid发现,进入数据中心的电能有25%的转化为电源分配单元、UPS和开关设备上的热能。将这些设备移出数据中心,如果可能的话移出建筑物之外,可以降低你的总体能源消耗,因为这样不用再移除这些部件所产生的热量。
⑥监视你的电源管理
你知道你正在使用多少电能吗?你的服务器正在消耗的电能比厂商规范所说的是多还是少呢?你的设备的电能消耗是否已经接近让你进行下一次升级的时间呢?
一个针对电源和散热系统的基础设施监控系统应该是你正在计划的升级的一部分。主动管理和监控你的能量使用,将帮助你对未来进行计划,可以帮助你评测你所采取的太高数据中心效率的措施的效果。
相比直接对业务相关领域进行投资,说服高级管理者投资来进行数据中心的完善是一个挑战。你可能不得不需要一点一点的搭建你的监视系统。但是在你进行大的节能和提高效率的设计之前,增加对你的数据中心的监控系统是非常有意义的。它可以让你从已经建立一个有意义的标准,从它来判断你的改变的效果,从而更有效地为将来做规划。