一、 IT建设的三大浪潮
回顾IT信息化建设发展趋势,不难发现用户的IT建设需求是个由低到高的过程,每个用户IT建设基本规律,都是遵循从IT基础设施,到应用系统,再到运维保护的一个过程。IT基础设施阶段的建设核心是围绕计算机、网络、服务器展开的,在这个阶段除了成就了像IBM公司、Mircosoft这样的以提升计算能力为核心目标的行业巨头之外,也成就了像联强、神州数码等一批工贸商。
从04年到09年,随着十一五规划的推进,大量的政府、企事业单位用户开始集中化使用网站、OA、ERP、政府的各种业务系统,在这个阶段,业务系统解决方案供应商快速成长。从07、08年开始,用户的需求更多是看中业务系统的安全可靠、系统的稳定运行、应用的不间断,大量做安全、防护类产品厂商得到快速发展,在IT运维时代,大家对于网络安全、计算机安全特别关注,尤其是计算机系统的核心——数据安全意识与日俱增。在这种背景下,容灾走进了我们的视野。
二、 容灾的价值
随着信息系统逐步上升为企业生产运行的中枢,如何保障信息系统的安全、稳定早已成为保证企业生产持续运行的关键。在过去数据量不大的时候,用户已经习惯了先存储,再备份,最后实施容灾的数据保护模式。但是,随着信息系统变得日益复杂,数据量快速增长以及存储新技术不断涌现,企业的数据备份系统以及业务连续性受到了前所未有的挑战。企业在部署备份方案的同时,也必须考虑到一些关键业务系统的安全和连续性。在IT运维时代,数据的商业价值凸现,容灾作为企业完善业务风险防范的最后一道屏障,在有效协助企业完成IT管理目标的同时,将职责落实到容灾系统和责任人,所以容灾不再是一个可选项,而是必选项。
数据的价值在不同的行业中大相径庭,不同规模的公司、甚至同一公司的不同应用程序也具有不同的数据价值。但不论对于中小型公司还是大型企业机构而言,由于网站停运引起商业机会损失,生产力闲置,客户满意度下降等等,都是不容小觑的损失。
为了更好的判断数据的价值,请您先衡量以下的问题:
1) 以小时来计,数据丢失对于受保护的应用程序会带来多大损失?
2) 以小时来计,延迟处理(尽管应用程序一段时间内不能运行,但数据并没有丢失)会带来多大损失?
这两个问题的答案转化成容灾系统的评价指标,就是业界公认的评价标准:RTO和RPO。
3) RPO(Recovery Point Objective): 恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。RPO标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO的值越小。
4) RTO(Recovery Time Objective): 恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。RTO标志系统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,RTO的值越小。
从这里我们可以看到,我们的IT系统稳定性与我们的业务系统价值是牢牢绑定的。
三、 容灾,IT建设必需品
有研究报告显示,根据调查数据显示,企业的信息系统可能遭遇的各类灾难中,发生自然灾难的机率仅为3%,而有超过95%的数据丢失是发生在本地站点,其中,47%是硬件级别的故障,还有高达53%的“软”错误引起的灾难,如数据误删除、系统崩溃、黑客病毒攻击等。 而在过去5年中,世界上93%的公司拥有丢失过重要数据而造成业务损失的经历,有72% 的业务没有可靠的容灾计划,而只有18%的最后用户的数据得到了可靠保护。也就是说,全球有82%的数据都处于危险之中,一旦损坏将很难再找回。这是非常触目惊心的一组数字。难道这是因为用户对于数据保护的认知程度依然不高吗?
实际上恰恰相反,随着近年来大环境的影响,使得信息系统的灾备建设成为各行业IT建设的重中之重,同时信息系统的价值各类新技术的不断涌现也为企业容灾建设降低了门槛,越来越多的企业在关注数据安全的同时,也对业务连续性提出了更严格的要求。然而,在实际应用中,真正部署高可用、高效率的数据保护系统的机构和组织却寥寥无几。
之所以造成这样的局面,跟许多企业的IT系统现状是分不开的。随着业务的发展,许多企业的数据中心存在不同时间建设的多个IT子系统,异构的系统环境给数据中心用户带来了新的困惑:现有的存储系统是由不同厂商的存储设备组成的,架构庞大并且十分复杂,加之从数据存储再到数据容灾和应用容灾中间涉及的流程太多太庞杂,使得存储、备份以及容灾分步进行的周期过长,对业务压力过高,实施难度也比较大。是否有一款合适的产品和解决方案可以达到异构环境下的平衡?
而另一部分中小企业,在数据备份系统建设才刚刚起步,对应用系统的容灾还处在可望而不可及的阶段,是否有一套完整的解决方案可以一步到位?
四、 一体化容灾推动容灾普及
通常在建立一个容灾项目的规划过程中,设计者需要考虑一下几重因素:目标、规模、风险、成本。
在选择容灾方案时,设计者需要考虑两个核心点:性能和管理。首先将目标、规模、风险三大因素结合起来,根据风险系数、风险产生的机会成本进行IT系统等级划分,结合RTO、RPO目标,确定性能指标。其次将结合方案的应用和部署方式,匹配容灾方案的管理目标。
而容灾项目的成本又是是由前三者综合决定的。传统的容灾系统建设,除了场地、设备、传输网络费用等初始成本外,还有高额的运维费用支出,以及潜在的机会成本。
以往用户在考量容灾方案时,由于对整体建设成本的估计不足而导致的运维难的例子比比皆是,特别是由于技术和人力有限,许多用户自己无法管理和维护容灾系统,面对庞杂的业务系统,只能依赖于每年向多个厂商购买专业应急服务。一旦出现事故,用户不仅需要向各服务厂商支付大量的业务恢复服务费用,还无法控制专业服务的响应时间,快速恢复业务根本无从谈起。
这也就意味着,企业在衡量容灾系统是否物有所值时,考虑的不仅仅是方案的投入,还需要掌握真正的成本预估规则,避免容灾系统的重复投资和资源浪费,整合系统和方案,从而有效降低容灾建设成本。
面对用户的本质需求——数据不丢失,应用不间断;面对企业的基本诉求——保证IT系统的有效性,帮助企业机构应对风险。性能良好,管理智能,整体性强,成本可控的一体化容灾方案才是用户真正的期望。在一体化容灾方案中,通过只用购买一套系统来降低初始成本,方案覆盖本地数据备份、异地数据容灾、本地应用容灾和异地应用容灾的能力可以做到数据不丢失和应用不间断,并能实现一套系统一个厂商的专业维护,来全面实现容灾建设成本可控和物有所值的平衡,最后降低容灾门槛,让想用容灾的用户用得起用得好容灾,容灾真正成为IT建设中不可缺少的必需品。