在信息密集型机构中,许多部门和级别的人员都可以做出影响数据中心运营效率的决策。金融交易员可以选择运行复杂的蒙特卡洛(MonteCarlo)分析,而药物研究人员可以决定要将多少临床实验影像数据存储起来。负责应用程序开发的管理人员可以决定用多少编程工作来满足这些需要。服务器基础设施的管理人员可以做出设备采购决策。设施主管则可以决定数据中心的位置、电力供应,以及在预测的需求出现前安装设备的时间表。
上述决策通常是在孤立状态下做出的。销售经理可能会选择将交易由隔夜结算改为即时结算,金融分析师则可能希望为历史数据存储几份副本,他们完全没有考虑到这样做会对数据中心的成本造成什么影响。应用程序开发人员很少想到要对自身的工作进行优化,以将服务器用量降到最低,也很少考虑开发能够跨服务器共享的设计应用程序。购买服务器的管理人员可能会选择价格最低或他们最熟悉的产品。但是这些服务器也许会浪费数据中心的电力或空间。很多时候,管理人员会超额购买设备,以保证在最极端的使用情况下拥有足够的容量,而这会造成容量过剩。管理人员往往会建造有多余空间和高制冷容量的设施,以满足极端情况下的需求或应对紧急扩建。
这些决策在整个机构中累加起来,将对成本和环境造成重大影响。在许多情况下,公司可以在不降低自身数据管理能力的前提下,停用现有的部分服务器,并搁置购买新服务器的计划。这可以借助一些众所周知的技术来实现。比如虚拟化,这种技术实际上是通过寻找服务器的空闲部分来运行应用程序,以达到容量共享的目的。但是公司不一定会这样做,因为没有哪位高管能够承担“端对端”的责任。在机构内部,管理人员会以最符合自身利益的方式行事,这就造成大多数数据中心效率低下,每台服务器上常常只运行了一个软件应用程序。
我们分析了一家媒体公司的近500台服务器,其中利用率低于3%的占三分之一,而低于10%的则占三分之二。虽然有诸多用于跟踪使用情况的现成管理工具,但这家公司没有使用其中任何一种。从全球来看,我们估计服务器的日常利用率一般最高只有5%到10%而已,这造成了能源和资金的浪费。对此,数据中心管理人员一般会回答,配备这些服务器是为了在极端情况下提供容量,例如应付圣诞节前一天的购物潮。但一般来说,这一论断并不成立,因为数据显示:万一平均利用率极低,那么高峰时段的利用率也会很低。此外,数据设施的数量不断攀升,但所存放的服务器和相关设备有时仅占数据设施容量的一半,这说明有上亿美元的资本支出被浪费了。即使公司报告认为数据中心已经满载,但沿着数据中心的过道行走,经常会发现服务器机架上有很多空位,原先放在这些空位中的设备都已经淘汰。