看着一路攀升的温度曲线,整个一个出门就被烤化了的节奏,再看下日历,果然,三伏天不远了,高温天气即将来袭。每年的这个时候,最担心的就是机房里面的诸多硬件,在高温天气下不间断的运行,不仅性能受影响,一不留神,服务器就挂掉啦。
对于运营者而言,服务器宕机就意味着应用程序无法运行,也就是常说的业务停顿。服务器“罢工”会造成什么影响呢?2013年8月,电商巨头亚马逊因服务器宕机,40分钟损失了500万美元的经济损失。有研究机构统计数据表明,对于金融业而言,业务中断一小时的损失高达645万美元,医疗行业的损失是64万美元。以一家900床位的三甲医院为例,年营业额如果有8亿,每天的收入就是200多万,业务停顿意味着每小时损失十万人民币。
如何避免业务停顿?
信息业务量较大的公司(例如:电信等运营商)大多会选择采用相同版本的数据库服务器部署ORACLE RAC群集,来确保业务的连续性。然而,每年各大运营商都会发生因为服务器宕机而不得不暂停对外服务的IT故障,显然RAC并不是保障业务连续的万全之策。
大多银行机构都愿意部署高可用方案(HA)来实现数据的冗余和应用的冗余。不过也会因为服务器“脑裂”而导致主、备服务器误认为对方宕机,而同时接管对方的业务,最终造成业务停顿。
服务器宕机的原因有很多,要保证万无一失谈何容易。作为信息安全领域的专业容灾备份厂商,北京和力记易科技有限公司的张明总经理建议“为了避免业务停顿,容灾备份方案,尤其是CDP(持续数据保护)应用级容灾备份,必不可少”。
在生产服务器和备份服务器上分别部署备特佳CDP容灾备份软件,进行业务接管设置,一般建议将备份服务器部署在与生产中心不同的IDC机房,可以是本地的也可以是异地的。当服务器因意外宕机时,备份服务器可以手动或者自动接管生产服务器的IP、机器名以及对外的相关服务,充当生产服务器的角色,保障业务连续。当生产服务器恢复正常之后,又能通过软件将最新的数据进行恢复,保证数据完整可用。概括的说就是“业务恢复时间短,RTO≈0;备份数据完整可用,RPO=0。”
为了保障业务连续,在考虑灾难恢复解决方案的时候就必须明确实际需求。上面说到的RPO(恢复点目标)和RTO(恢复时间目标)是两个最常见的指标。RPO是衡量由于服务器停机而可能损失成本数据量的指标,RTO是可以离线时间量或者说是业务暂停时间量的一个指标。这两个值越小,因IT宕机所造成的损失也就越小。不难看出,与传统的快照、镜像类数据备份软件相比,和力记易的CDP应用级容灾备份方案在应对误操作、软硬件故障、恶意攻击等因素造成的IT宕机问题具有明显优势。在高温天气来临之前,着手部署个CDP容灾备份方案,先下手为强吧!