灾害与风险具有不可预测性,企业也难以每次准确捕捉到即将面临的威胁。但通过以下七大步骤,你可以大幅提高商业持续性与容灾恢复计划的效率,增加自身的抵抗力。
步骤1:认识威胁的存在
商业持续性与容灾恢复(BCDR)计划的第一步首先是要认识到企业面临着有形的威胁,并且会对公司资产构成损害。只有公司管理层意识到这一问题,以下的步骤才能顺利展开。
步骤2:列出并分类企业可能面临的威胁
商业、物理及社会环境都会影响到企业所面对的威胁种类。在列出威胁之后,应当根据它们对系统可能的影响予以分类。容灾响应的成本应当视企业对系统恢复时间的要求而定。恢复时间越快,响应成本就越高。有些关键系统必须在若干分钟内恢复运行,而有些可以当机几个小时到几天不等,也不会产生太大的影响。
步骤3:规划企业BCDR技术基础架构
BCDR基础架构主要是由一座主数据中心、一个用来复制资源的远程站点,和一条高速网络连接所组成。非常好的的BCDR战略应当自始至终地贯穿“冗余”这个概念。大型机和服务器应当配备数据备份工具,这样当任何组件遇到问题时,就能立即切换到本地备份作为第一道防线。在BCDR战略中,供电稳定性是一大关键。根据行业分析,供电中断是最常见,也是最容易预防的威胁。
此外,网络部署如果缺乏审慎的规划,也会变成一种负担。因此网络连接不仅要留有足够的冗余,而且必须根据广域网(WAN)拓扑中的不同路径来防止某一威胁造成商业运营的中断。
步骤4:盘点企业IT资产
在企业规划完BCDR基础架构拓扑后,下一步就要准确盘点其IT资产。这能让企业了解自己有哪些资源与商业流程需要被保护。
市面上有一系列的企业管理工具可以帮助公司制定并维护IT资源。这些工具厂商提供了软件与模块来扫描IT基础架构,储存硬件与软件资产的详细信息,以及它们在配置管理数据库(CMDB)中的配置参数。
步骤5:设置服务等级预期,定义恢复策略
CMDB不仅储存了企业硬件与软件资产的详细信息,同时也收集了服务等级协议信息,定义出这些IT资产的运行时间和恢复参数。如步骤二中所提到的,企业管理层对服务等级预期的认可至关重要,它决定了某项IT资产需要在多少时间范围内进行恢复,同时也直接影响了BCDR的预算开支。
只有在明确的资产、配置和服务等级协议知识的基础上,企业才可定义出突发情况恢复策略。这一策略必须得到管理层的支持,并将IT资产绩效直接与商业要求关联起来。要做到这一点,企业将需要执行一套商业影响分析,获取系统要求、流程和系统内部关联性的详细信息。而管理人员也需要了解系统中断所带来的后果,以便对突发情况恢复策略提供充分的支持。
步骤6:制定BCDR恢复计划
突发情况恢复计划详细定义了部门与个人在保持技术系统可用性方面的角色与责任,以及在发生紧急情况后恢复IT系统的流程。一份有效的计划应当包括资源要求、培训要求、培训与测试的频率、维护计划,以及数据备份计划等要素,并覆盖从紧急情况发生时的通知,到处理团队到位后的恢复措施,到最终恢复正常运行的所有流程。
步骤7:测试BCDR恢复计划
专家认为,容灾恢复计划中最重要,但却经常被忽略的一个方面就是在制定了正式的策略和流程之后,没有定期去测试它。恢复计划必须接受持续的测试,以检验其效率与完善度,并根据IT基础架构和商业流程的变化做出相应的调整。
现实环境的复杂性或许无法让企业规避每一次威胁,但是通过适当的技术、明确的服务等级预期、务实的恢复策略、完善的恢复计划,以及严格的测试机制,企业完全可以将灾害所带来的商业影响减少到最低。