这样看来,如想让“双机集群容灾事,飞入寻常企业家”,就必须提出保证业务和数据安全的前提下,成本更加经济的容灾方案。最理想的方式是在原有的双机方案基础上进行升级,尽量不去改变用户现有的网络和存储架构,最大限度地保证初期 IT 建设的成本不被浪费。这也正是爱数进行双机集群容灾方案设计时最基本的出发点。
最利于操作和部署的双机集群容灾方案,应该是不需要生产服务器双机及集群和容灾服务器型号完整一致,不用担心后端存储系统的兼容性问题,无需改变原有的网络架构,只需在网络中部署爱数备份存储柜或爱数备份软件,并在双机集群中的每个服务器上安装客户端软件,划分相应的存储空间,部署相对简单,并且能够在 同一Web 界面上进行统一管理,大大降低了操作难度和管理成本。同时,新的故障检测技术、CDP 技术的引入,该方案可以满足较高的 RTO/RPO 的指标要求,下面让我们来简单分析一下这个方案是如何工作的:
在生产服务器端,双机集群系统将被视为一个有机的整体,任意一台服务器在对外提供服务的时候,该机器上挂载的共享资源都会被客户端程序实时监控,变化的数据会源源不断地被输送到爱数备份存储柜或爱数备份软件这个中间层中。同时基于源端的重复数据删除技术不断地精简实时复制数据,减少网络传输量和存储数据量。在爱数备份存储柜或爱数备份软件端,任何生产服务器上的发生变化的数据都将生成一个时间点,保证了任一时刻数据的可追溯性,实现了对存储数据的 CDP 保护,能够有效避免应用逻辑错误,同时爱数独有的时间点生成策略为用户提供了个性化的数据存放方案,不但满足了不用用户对数据保存周期的需求,并且降低了空间使用率。
容灾服务器可部署在爱数备份存储柜内置的虚拟化平台中,容灾存储也是如此,这样就无需增加额外的物理设备。除了 CDP 数据以外,容灾存储上永远会保留一份最新的生产数据,使得共享存储端在发生故障时,该份数据可直接被使用系统使用。
那么,当双机/集群中对外提供服务的机器发生应用故障时,会即刻触发切换操作,客户端软件上搭载的智能化故障检测模块也会第一时间将监控对象切换为当前工作主机上的资源,保证其开始对外提供服务时,已经开展了有效监控,保证实时复制数据的有效性。简而言之,任何一次切换发生时,CDP 的保护对象也将随之切换。唯一不变的是,爱数备份存储柜或爱数备份软件的容灾存储上的数据保持和生产存储一致。
万一双机/集群系统的磁盘阵列发生故障,双机系统彻底瘫痪,容灾服务器可立刻接管双机应用系统,并对外提供服务。万一存储系统从故障中恢复,可将容灾服务器上的最新数据反向复制回原磁盘阵列。并在双机修复完成之后,通过手工接管方式将存储切换回来。万一存储阵列发生逻辑错误,管理员可将应用恢复到发生错误之前的任意一个时间点,有效避免了传统方案中数据没有可追溯性和使用定时备份方案可追溯性差的问题。
至此,我们看到了一个基于原有双机/集群架构的应用容灾方案,它没有浪费任何的初始投资,将企业现有的双机系统充分利用起来,在拥有 RTO/RPO 指标最小化的同时,实现总体拥有成本的降低。这是爱数又一次 ROI 理念的实践,为双机集群容灾方案的广泛应用提供了强大的驱动力,在实现爱数普及容灾方案理想的漫长道路上迈出的坚实一步。