系统检测到您所使用的浏览器版本较低,推荐使用FirefoxChrome浏览器打开,否则将无法体验完整产品功能。
×

认识绿色高性能计算

本文标题:认识绿色高性能计算

    “绿色”是今年的一个热门词汇。然而对于高性能计算来说,想要绿色并不那么容易。的确,在一个以性能为主导的市场中,其他任何因素都要为性能让道——直到数据中心电力费用单送到你的手上,或者你的数据中心无法获得更多空间、能源或者冷却资源的时候。

    绿色高性能计算实际上是优化了的高性能计算。性价比往往是用于评估多个硬件解决方案的标准之一,除非你有不受限制的预算开支。虽然性能很容易测量出来,但是价格就有很大差异了。一般价格包括基本的硬件配置成本,而完全忽略了运营成本。就当前的服务器市场来看,这种分析方法是缺乏远见的。举一个例子就可以说明这个问题。

    一台普通的1U二路集群节点的能耗大约在300瓦左右。如果冷却和电力系统效率较低的话,能耗可能会增长到600瓦。因此,一个集群节点每年就需要5256千瓦时的电力。如果以每千瓦时10美元的标准计算,这个集群节点每年的能源和冷却成本大约是526美元。

    然而要是从整个集群的角度来计算的话,这个成本就相当惊人了。以通常的集群采购来举例,一个节点的成本大约为3500美元(其中包括机架和交换机等)。使用标准的四核技术,一个节点配置两个处理器和总共8个内核。以平均节点成本计算,一个普通的128节点集群(配置256个处理器和1029个内核)的成本大约是448美元。根据上面的计算,年平均能源和冷却成本就是67300美元。以三年计算的话,成本就是201900美元,占总系统成本的45%。

    虽然成本会随着市场挑战和数据中心选址不同而上下浮动,但是上面的分析证明,数据中心三年的运作成本轻而易举地就达到了采购一个通用集群成本的40%~50%。

    因此,更准确地计算性价比还应该包括基础架构或者运营开支。忽略这些成本往往获得的是一个理想化的结果。而且,总拥有成本往往可以反映出运营成本情况,但是对于高性能计算来说,我们更倾向于选择基于性能的测量,也就是价格性能比(price-to-performance ratio)。

    绿色就是性能

    基于我们上面的分析,能源和冷却成本的降低自然会引起价格性能比的下降(价格性能比越低越好)。这个结论令人感到意外,因为绿色计算通常是与低能耗系统有关系的。就高性能计算来说,绿色并不一定意味着速度减慢,它意味着高效。下面我们就会降到高性能计算系统提高效率的多个途径以及绿色高性能计算的新方法。

    绿色服务器

    因为现在很多通用机架式服务都采用相同的处理器、内存和硬盘驱动器,所以我们在这里不一一解释了。现在很多新型处理器以及集群中都提供了新的节能特性:

    电源:如果你使用的是标准机架式服务器,那么你可以控制的一个区域就是电源。确保你使用的是功率因数校正型(Power Factor Correction,PFC)电源。一个功率因数校正超过0.8的电源是高效电源。遗憾的是,未经校正的电源的功率因数可能在0.7~0.75之间,也就是造成了资源浪费。一个好的PFC电源功率因数应该在0.95~0.99之间。过去,30%~40%的电力都被浪费掉了。更好的电源能够提高效率达80%。

    采用时间管理

    正如上面提到的,大多数厂商都非常关注能源效率。英特尔和AMD分别采用Intel SpeedStep以及AMD Cool'n Quiet技术对他们的处理器产品进行动态频率控制。通过修改某些代码就可以实现对处理器时钟频率的动态变更。这样,当一个处理器处于空闲状态的时候就可以将其关闭。如果你在节点间使用了硬盘驱动器,那些现在有不少硬盘都自带了绿色节能模式的设定功能。

    控制上述能源节约特性最有效的方法就是使用管理器。一般来说,任务管理器掌握着每个节点的状态。我们很容易向其中编写代码,让CPU或者硬盘驱动器在空闲的时候处于低功耗模式,在运行任务的时候启动运行模式。

    另外完全关闭那些处于空闲状态的节点也可能达到节能的目的。Sun Grid Engine和SLURM都计划提供这种功能特性。这种功能对于无磁盘节点有很大用处,因为在无磁盘节点是通过网络来完成快速启动和节点分配的。通常在通电之后60秒内节点就可以准备就绪了。

    还有一个方法是使用管理器来控制物理任务的分配。这种方法是将任务分配或者迁移到温度较低一些的机房环境内。

    绿色机架

    改善机架也是“绿化”集群的有效方法之一。通常一台 1U服务器至少有10到12<

官方微博
官方微信
QQ交流圈

扫一扫,关注全民竞赛网QQ群交流,反馈您的建议,集思广益