信息化 频道

提防灾难

没有终点

        灾难备份,顾名思义就是对可能被灾难破坏的数据、数据处理系统、网络系统、基础设施及运行管理能力备份的过程。不过,灾难备份并非灾难恢复的全部,它更重要的内涵是恢复组织的业务。GDS总裁黄伟指出,在他接触过的建立灾备措施的企业中,不少企业会陷入两种误区:“一是重复建设;二是建设无效”。属于后者的企业并不是因为建立的灾备系统无法使用,而是缺乏维护和相应的业务持续性规划,使得巨资打造的灾备系统变成又一个信息孤岛。
        “如果没有灾备中心,出了问题还可以将责任分担;如果有了灾备系统却启动不了,IT部门的压力会大很多。”孙建光说。这几年,创新安泰逐步建立了一套完整的业务延续性计划(BCP,Business Continuity Plan)。其中,IT灾难恢复计划是BCP计划的重要部分。创新安泰不仅对日常IT的工作规范进行了严格规定,如软件变更和安装尽可能保持一致,将风险防范落实到责任人、理顺流程,以便一旦出现灾难大家各司其职,确保灾备方案能够迅速得以执行。
        “未经测试的灾难恢复计划是无效的!”从灾备系统建设至今,创新安泰进行过两次规模较大的演习:一次是假定总公司的机房遭到破坏,另外一次是假定分公司遭受疫情危害而无法办公,在这两种假设场景下进行业务快速恢复。在演练中,他们将不同业务按关键度,分为12小时、24小时、48小时乃至72小时内恢复的等级,制定了相应的演习计划,由所有内部用户、IT人员及BCP小组共同执行完成。这不仅是对灾备系统的检验,同时也是对全体员工的现场培训。至今,创新安泰已建立了三四种灾难恢复预案,以应对各种可能出现的灾难。
        现在,创新安泰的电脑屏保甚至都会不断出现信息风险管理内容,几乎所有员工都知道在突发状况时,应如何应对。为此,他们还编制了详细的“灾难恢复流程手册”,假定在最极端的情况下,一个专业人员都没有,非专业人员也可以根据手册操作流程说明,恢复信息系统。
       建立BCP是一个长期而复杂的过程,且需要随着企业的业务变化而不断演进。“IT部门应该建立一张业务与系统的关联影响图。”中国网通辽宁分公司企业信息化部经理官涛用这张图拟定了IT灾备预案。

        “每个用户都有它关注的几项功能,每项任务的几个节点连接起来就是我的监控点。通过这些点来制订我们的维护和执行规程。”官涛强调,企业灾备应以预防为主。为此,他会定期请外部人员对信息系统进行“健康检查”;之后,在此基础上建立应急预案,“一旦系统出现故障,恢复流程会非常清晰,故障节点也能很快被排除,从而在最短时间内恢复业务运转”。

        CIO不要以为灾备建设像正常IT项目一样,是一笔一次性投入,灾备体系需要不断维护、不断加强,否则就会出现“建设无效”的现象。深圳发展银行尽管已经花巨资建立了灾备体系,但它每年还会在灾备上投入上千万元,以进行灾备演练等工作。

        不过,灾备投入并非是“无底洞”,灾备系统也不会被闲置起来。今年4月,创新安泰在北京分公司的语音灾备系统正式完成。原本出于提高工作效率、节约成本,创新安泰已经通过VoIP将全国各分公司与总部的电话连接在一起。现在,北京建立了语音灾备中心,其日常可以作为公司呼叫中心的一部分,一旦总公司系统出现问题,它会立即将总部呼叫中心和办公电话业务“接管”过来,以保证呼叫中心和各分公司的正常运行。(IT经理世界)

0
相关文章