随着企业信息数据的快速增长,特别是非结构化数据的快速增长,给企业存储的空间容量、数据管理、数据归档带来了诸多问题和巨大压力。而存储市场上,我们也会发现IBM、HP、EMC、NetApp、HDS、Dell、Isilon、BlurArc等国际存储厂商们纷纷在最近一两年把精力放在集群存储领域,市场上也涌现出越来越多的集群存储产品,集群存储也以其高度的扩展性、灵活性、高性能越来越受到了人们的关注。今天这篇文章里将谈谈笔者对选择集群NAS系统需要注意哪些事项?以及什么样的应用适合选择集群NAS系统?
选择集群NAS系统,首先需要对你们公司的非结构化数据类型(视频、音频、文档、邮件等)以及环境有充足的了解,这样才能在选择集群NAS系统中做到有的放矢。集群NAS归根结底是一套捆绑了分布式文件系统的硬件。因此,我们在选择集群NAS系统时,需要重点考虑的是文件系统和硬件系统两个方面。
你在选择集群文件系统的时候,可以考虑纯粹的软件解决方案,比如说赛门铁克的Veritas Storage Foundation、昆腾的StorNext;业内更多的是软硬件捆绑的集群NAS解决方案,比如说Isilon、IBM SoNAS、HP公司 X9000、Dell Exanet、BlurArc Mercury等。无论选择哪种解决方案,我们都需要了解集群NAS的本质其实就是将数据和元数据条带化至多个存储节点以及子系统上,同时提供了从集群任意节点对所有文件的访问,而不用知道具体文件的物理位置在哪里。那么下面就来详细谈谈笔者认为的选择集群NAS系统五大要素。
一、文件系统最大管理能力
集群NAS不可回避的一个问题就是文件系统下可管理文件数量和容量有多大。有些集群文件系统,当文件对象数量超过限制时,就会出现没有任何预先警告的情况下自动关机。因此,认为文件系统在容量和数量上的最大管理能力,对于用户非常重要。
二、集群NAS的扩展能力有多大?
集群NAS之因此受到人们青睐,一个非常重要的原因就是扩展能力强,用户可以通过增加节点来提升IO处理能力,比如像Isilon、BlurArc等公司的集群NAS产品都具有非常灵活的扩展能力,能够通过节点并行化来提升用户的处理速度。万一集群NAS不是每个节点都可以同时被写入数据,用户可能会遇到I/O传输的问题,在这个情况中,写入请求将会被输送到数据文件系统的主节点上。而这样的话,会大大影响到正常性能的发挥。因此,用户对集群NAS系统的扩展节点数需要有深入的认识。
三、集群NAS系统适合哪种类型的数据?
千万不要以为集群NAS系统就是适合放那些富媒体数据,其实什么样的集群NAS系统放什么样的数据非常有讲究,厂商的产品往往相对会针对不同的应用,比如说BlueArc的Titan系统以及Mercury系统还有HP的 X9000,还有Isilon的X-Series系列都是那些希望存储大量序列文件如富媒体或者视频用户的上佳选择,而Isilon公司自身通过磁盘的不同(有采用SAS磁盘的、也有采用SATA磁盘的)来组成不同的产品线。因此,我们在选择集群NAS系统时,一定要了解需要采用集群NAS存放什么类型的数据,这样才能够选择到合适的集群NAS系统。
四、明确IO属性
另外一个不能忽视的就是用户自己的IO属性,比如像HPC环境,在IO方面的需求可能就是单一存储对象访问大量文件;而像媒体娱乐等行业,则是大量文件下的反复IO读取操作应用为主;传统搞得数据库应用则是追求高IO。像HPC环境下,HP公司的Ibrix文件系统可能比较适合;而媒体应用的话,Quantum的StorNext则非常适合;传统的数据库应用,则HP公司的ExDS9100比较适合。总之,对自身企业的IO属性了解,非常有用。
五、集群NAS适合高使用率的用户
万一需要的仅是为了存储非结构化的数据,那么笔者并不建议用户选择使用集群NAS系统。相反的,笔者认为那种传统的NAS系统更加适合这种需求的用户。万一需要的是仅仅是更好的性能,那么笔者也不建议使用集群NAS系统,单纯地追求性能而使用集群NAS是一种误区。集群NAS非常高存储使用率、并且IO反复读写的使用环境,因此有这种使用环境的用户,选择集群NAS系统将是非常适合的。
到现在为止,无论是像IBM、HP、Dell、EMC、NetApp、HDS等大型存储厂商,还是像BlurArc等小厂商,都具有丰富的集群NAS产品,市场上供用户选择的产品比较丰富,用户只要根据上述五点、再结合自身的实际情况,一定能够选择到最适合自身的集群NAS产品。