运用集群技术来扩展服务器的性能、容量、连通性和实用性已经没有什么可好奇的了。然而,集群存储就是另外一回事了。
什么是集群存储
在集群里,一组独立的节点或主机可以象一个系统一样步调一致地工作。它们不仅可以共享公用的存储阵列或者SAN,也可以拥有只有一个命名空间的公用文件系统。
最近的一些案例来自Cluster File Systems、Oracle、Red Hat以及新兴的Panasas和Spinnaker Networks公司等。Red Hat公司于去年收购了Sistina公司,该公司发布了适用于开放源码的集群Global File System。Network Appliance公司则收购了Spinnaker Networks公司,该公司现在正在使用其SpinCluster软件来改进网格战略,即对网络附加存储(NAS)以及SAN存储进行集群整合。Oracle公司也在该公司的真正应用集群(Oracle 9i RAC)上使用其Cluster File System。Cluster File Systems公司则使用其Lustre File System来建立高性能的集群。
在一些成功案例里,单独的服务器也是通过元数据服务器或设备与存储连接,元数据服务器或设备可以对数据进行很细的分类,以使这些数据可以很容易地找到。
更好的性能是一些用户使用集群文件系统的一个关键理由。某用户现在使用Lustre File System,他们通过构建的集群来进行科学仿真和模型建立工作,如今把两个1000节点的集群用于生产系统。以前,需要在每一个集群上安装文件系统,并且当有人需要数据时,经常需要把一个文件复制到另一个集群上去,文件系统之间频繁的FTP任务对整个系统的性能造成了很大的影响。而现在他们能够随时将数据从文件系统中调出来阅读,在不影响正常仿真任务进行的同时查看系统运行结果。
集群存储的优势
通常,集群存储总是和高性能计算联系在一起,不过事实上,集群存储正快速被主流的商业环境所采用。这些商业领域被集群存储的优点所吸引。集群存储通过采用开放访问方法,如NFS和Windows CIFS,以及使用业界标注和第三方存储,对现有的技术和协议加以利用,如以太网、光纤通卡以及InfiniBand协议。
现在,发展速度最快的集群存储解决方法可能是网络附属存储(NAS)文件服务器。企业需要摆脱单一存储结构的限制,扩展到能够对结构化和非结构化的数据进行管理。这样的需求对集群NAS技术的部署起到一定的推动作用。
集群NAS系统在许多层面都具有可扩展的优势:
◆能够提高大型的序列带宽(吞吐量)的性能,或提高小型IOPS,即每秒输入输出次数(事务型)以及元数据查找的性能;
◆扩展存储容量;
◆提高基于本地或以分布式的可用性,与设备或站点故障相隔离;
◆扩展的灵活性,包括同时访问相同或不同的数据以及由于不同的应用需求对数据进行平行访问;
◆具有提供模块存储增长的扩展能力;
◆提供了易于管理任务的扩展性,例如存储的精简配置、负荷平衡以及数据保护