信息化 频道

灾备现状及解决之道问答

    【IT168 信息化

    以下是GDS万国数据副总裁汪琪就中国目前灾备发展状况及解决思路所谈的部分观点,各位请参考。如有需要可单独安排汪总或GDS公司其他高层领导接受采访。

    Q:灾备一般会分集中于IT的灾备和恢复、集中于业务的业务连续性管理和企业战略的可持续发展等几个阶段,目前,中国企事业单位的灾备水平大多属于哪个阶段?灾备较发达国家的企业现在发展到了什么水平?

    汪琪:灾备的起源最早是数据备份和恢复,之后是业务应用系统的备份,在这个基础之上,企业开始将业务的因素考虑进去,业务的连续运营成为企业追求的目标;从而又引入了业务影响分析、风险分析和规划等。业务的恢复涉及到很多业务的流程、资源的调配、人员和组织架构的调整及恢复的策略等多个方面,我们称之为业务连续性规划。第三个阶段是业务的连续性管理,涉及危机处理、上下游问题的应对等管理型问题;业务连续性管理已经将灾备从数据备份和恢复提升了管理的高度。

    目前我国企业的灾备大部分还处在第一阶段,即数据和应用系统的备份和恢复,也有些企业在做一些业务连续性规划或正在准备做这样的工作。目前我国还很少有企业达到第三个阶段。

    从国外情况来看,上世纪七八十年代,灾备起步,大部分机构和企业都在做第一阶段的事情,上世纪九十年代尤其是2000年前后,因为千年虫和突发性灾难等事件,国际上的一些企业开始特别重视业务连续性规划和管理,这推动了灾备理论和体系不断向前发展。现在,国外灾备比较发达国家的企业谈的更多的是业务连续性管理,也就是说,他们的理论体系已经发展到了这一步,但这并不代表他们已经走到了这一步。

    对于企业来说,灾难恢复仅仅能够保证灾难发生之后数据系统的相对完整性,也就是“一旦灾难发生,数据丢失量有多少”的问题。而业务连续性管理解决的却是灾难发生之后企业的业务恢复能力,也就是“一旦灾难发生,企业能够在多长时间内恢复多少业务”的问题。相对于灾难恢复,业务连续性管理更像一个“IT+业务+管理”的混合体。由于金融企业在资产规模、业务性质、客户数量、业务处理能力、管理理念、企业文化等方面存在差异,因此相对灾难恢复而言,业务连续性管理的个性化更加鲜明,也更难套用和复制其他企业的成功经验和模式。业务连续性计划才是企业真正获得永续经营的法宝。它能够帮助企业继续获得核心组织功能,保护国家利益和主要职能,同时保护市场份额和收入,减少破坏时间和损失,保护股东、客户、员工的利益和信心,保护品牌和信誉,使得企业在灾难中获得重生。” 

    其实,建立灾备系统更重要的意义不仅仅是在灾难发生的时候帮企业把损失降低到最小。更是在建设的过程中发现企业的问题、发现哪些灾难、危机是企业的致命伤。帮助企业去评估它面向风险时候的相应的控制手段和措施,找出遗留的风险。防患于未然。更可以将你企业面临的风险进行优先排序,在进行灾备建设时候节省成本,将有限预算花在刀刃上。

    Q:金融行业是对灾备建设要求很高的行业,也是贵公司着力开拓的行业,您认为国内金融机构在灾备管理方面普遍存在哪些问题? 

    汪琪:总体来说,中国的金融行业尤其是银行业在灾备和业务连续性管理方面领先于其他行业,它们已经有了一定的灾备基础设施、一定的流程制度和管理规范。不过其灾备目前主要还是IT为先,在业务连续性管理、资源配给、组织架构的完整性和覆盖的范围及深度方面还有一些不足。

    金融业的灾备建设还有很长的路要走,我认为主要还需在如下几个方面做出努力:其一,要从集中于关注IT层面的备份向业务连续运作层面提升;其二,要把有关灾备的IT工作做深、做细、做广。现在很多金融机构仅仅是备份了核心系统,核心之外的其他很多系统在灾备中也很重要,需要企业进一步扩大范围。

    话说回来,即使是在金融行业,大家对灾备的关注度还不够高,参与的资源和力量也不够,这需要行业主管机构的更多指导和规范,需要企业高层管理人员进一步提高其灾备和危机意识。现在,中国金融业跟国际接轨,接轨也要求我们的金融企业遵循更严格的国际相关要求和标准;如果我们的金融机构要引入战略投资者,也要面对更多这样的要求。

    Q:您如何评价各机构在今年发生的汶川地震和南方暴雪等灾害中的灾备表现?灾备管理的价值又如何体现的?

    汪琪:在汶川地震过程中,几乎所有银行都做出了相对比较及时的反应,当地的银行调集了很多力量投入灾备,为民众提供了很多流动性服务,包括在路边搭起帐篷做业务;很多金融机构把系统搬到了总行或分行所在地,避开了地震活跃带。

    通过这几次事件,我们也看到了金融机构在应对突发性灾难中的重要性,因为不管是在救人阶段还是重建阶段,大量的资金和金融活动是必需的;灾难刚发生时,大家可能更关心的是怎么把人救出来,而到了恢复阶段,金融行业作用至为关键。实际上,我们已经看到,金融行业在面对突发性灾难时尽快恢复作业对整个社会体系的快速恢复非常重要。

   Q:在金融灾备系统建设中,GDS万国数据曾经提到过三种模式:专属系统热备份模式、数据备份/系统共享备份模式、基础设施和备用设备建设模式。这几种模式是不是各行业通用的模式,或者其他行业是否还有更好的模式?

    汪琪:这三种模式是可以面向所有行业的。选择何种模式,主要是看资源是独占的还是共享的;如何确定资源独占或共享,主要还要看客户的具体需求是什么,即恢复的时间目标(RTO)和恢复的点目标(RPO)是什么,这决定了企业要采用什么样的解决方案、要占有什么的资源。

    Q:通常我们所说的灾备自建、外包、共建模式各有什么利弊?对于一般性企业而言,选择的标准和条件是什么?

    汪琪:共建和外包的模式是希望能共享资源,降低成本,提高专业性;自建的模式适合规模非常大的企业,这样可以体现其规模效益,这类企业的模式和经验也很难跟一般规模的企业分享;对于一般企业来说,自建可能会导致资源闲置,经济效益低。

    总体来看,在这三种模式中,外包的优势会大一些,因为这是由专业的企业来提供服务的。在国外,采用共享模式(主要是指外包)的占到了70%左右的比例,国内目前采用独占模式的占很大比例,在资源独占的基础上将运行服务外包的模式也已经为众多企业所接受。

    Q:完整的灾备管理要有目标、有规划、有对策、有组织、有保障、有培训,在为客户服务的过程中,您觉得哪些环节遇到的问题最多?

    汪琪:首先我要强调灾备管理的整体性,灾备管理是整个体系的联动,从前期的分析、策略的制定,到中间的实施、运营,再到培训、演练,灾备中的哪个环节都不能有短板,否则,就会影响到整体灾备的实施。

    在为客户服务过程中,我们经常遇到的问题一般是一前一后两种问题。很多客户都很注重技术方案的细节及实施,但忽略了前期的评估、分析、规划和策略制定,以及后期的预案制度建立、流程开发和梳理、及长期的运维管理。这样就容易导致很多问题,比如,有些客户在技术方案已经基本确定的情况下,遇到问题时再回过头来做风险和业务分析,这样就容易导致分析出来的策略跟已经制定的技术方案不符,只能回过头来对技术方案进行调整;有些则是在流程体系和运行体系还不完善的情况下做实施,结果在运行两三年后,他们发现灾备中心和生产中心越来越脱离了,一旦生产发生问题,企业不敢轻易将系统和业务切到灾备中心。这些会导致企业的重复投资和资源的极大浪费。

    Q:我们应该如何做灾备项目中的成本效益分析?

    汪琪:灾难恢复的产出不在灾难的时候是看不到的。所以我们在做成本效益分析的时候,首先要分析这个企业如果是遭受了灾难,它停顿多长时间内所受的损失有多少。这个损失来自两方面,一个财务损失,一个是非财务损失,包括按形象的损失、法律诉讼、因为没有办法提供服务导致的罚款等涉及到危机管理方面的成本。

0
相关文章