信息化 频道

推倒“沉默墙” 做好灾难恢复计划

  【IT168 资讯】由于宕机而导致业务中断的情况不断出现,灾难恢复已经成为许多IT经理考虑的头等大事。这种情况在2005年也不例外。自然灾害、人类冲突和经常爆发的安全漏洞攻击都促使各种类型和规模的机构意识到需要实施或提高其综合业务连续性计划,其中包括IT灾难恢复计划。
   
  那么,灾难恢复计划到底包括哪些内容?备份策略,恢复脚本,还是安全漏洞修补流程?——有效的灾难恢复计划解决的并不仅仅是技术保护和恢复,而应只是作为更广泛的业务连续性计划的一部分,还需包括真正解决问题所必需的人员、工艺和程序——支持最终用户管理公司风险、对潜在破坏做出反应,并且能在完成新商业交易的同时保护历史交易,这些能力综合在一起可以确保公司在遭遇灾难事件时正常运转。但这对于大多数机构而言都是一个难以完成的任务,几乎没人能够完全准备好,以在期望时间内恢复关键业务流程。
   
  根据Applied Research公司的调查,在500名IT经理中,有70%的受访者已经实施了数据备份、复制和恢复技术,但是,只有略多于54%的受访者已经制定了完整的灾难恢复计划。而根据Infonetics Research公司的统计,大公司每年因为意外网络故障而造成的损失占年销售额的16%。因此,IT经理们针对各种灾难、事件或危机,制定有效的灾难恢复计划就显得至关重要。
   
  重在理解、沟通
   
  在Applied Research公司的调查中,大约有三分之一的受访者表示他们并不需要灾难恢复计划。因此,针对IT管理层和行政高层,使其理解与其进行沟通是关键。以下这些问题可以帮助管理者对制定有效灾难恢复计划的需求进行了解和交流,比如:在安全攻击或者IT服务中断明显影响到客户/合作伙伴/公司运营之前,我们能承受多长的时间?目前的信息是不是对所有被授权访问的人都是可用的,而未经授权的人则不能访问?是否制定了正确的策略来确保信息得到保护,免受内部和外部的威胁,并能在出现紧急情况时进行有效恢复?在遵从法律规范的同时,正确的数据备份、存档是否可以轻松访问,而多余的信息则被永久并安全地删除?是否应用了正规的数据信息更新过程,从而确保经常在远离现场设施长期保存的数据能得到完整性测试,并在技术更新和升级后还可使用?是否保存并定期维护所有购买的应用程序,跟踪许可号,最新版本,维护过的版本以及拥有的拷贝,并且还能对恢复进行优先级划分?
   
  另外还包括:应用程序的优先级是否已被获知并批准通过?是否理解了应用程序间的相互依赖关系?是否理解了应用程序和业务流程之间的相互依赖关系?这些情况是否都被记录在案并得到相关各方的同意?是否能先于最新漏洞和威胁对安全和可用性进行改进?如果出现紧急情况导致公司网络完全或者部分瘫痪,该机构可以多快将IT运营恢复至正常?该机构是否采用了迅速、无缝地重启业务流程以确保企业的继续运转?我们是否会测试计划来清除漏洞或者使其适用于审计或显示功能?我们是否真正理解到企业需要通过适当的投资来消除期望、实际功能以及风险承受能力之间的差距,从而满足这些服务水平?
   
  计划成本其实并不高
   
  在Applied Research公司的调查中,33%的受访者认为他们没有灾难恢复计划的主要原因是缺少资源。除此以外,成本也是他们在解释未能创建灾难恢复计划时经常提及的一个因素。
   
  但是,我们需要注意的是,同灾难恢复的影响相比,开发灾难恢复计划的成本就可能变得很低了——只需简单收集整理一些重要信息,如雇员和经销商联系清单、IT设备列表、现有的网络图示以及应用程序手册等,就是朝正确方向迈进。你可能会吃惊地发现居然有那么多的企业连这一步都没做到。在例行员工大会上花半小时来讨论一下谁应该负责处理灾难事故,而谁的责任又该是什么,这又是另外一个简单的步骤。经由管理层批准在灾难事故发生时自动增加IT管理方面的开支也是一个步骤。灾难恢复计划其实就是关于下一步该做什么。无论可用资源或者资金的水平如何,永远不会有十全十美的计划,它永远都有值得改进的地方。
   
  一旦IT部门清楚地了解到自己所处的环境、关键动机和可能的漏洞,就应立刻采取行动。第一步就是对所发现的危险情况进行优先级划分,通过缓和、认可或者分配等方式消除可能存在的差距。这些差距可能是由于政策、技术、员工、功能、过程、人为因素或者上述所有因素造成的。弥补这些缺陷可以帮助强化基础设施,从而防止潜在宕机情况的发生。
   
  另外,可以采取的措施还包括确保正确的技术、工艺和程序准备到位,从而可以在发生意外时进行即时恢复。
   
  推倒“沉默墙”
   
  尽管没有单位可以保证实现100%的恢复,但可以通过恰当的规划采取相应的步骤,从而帮助它们迅速恢复遭到破坏的基础设施。通过将灾难恢复计划集成到更大的企业业务连续性计划,公司机构可以保护公司正常运作,并且确保对客户、合作伙伴和投资者的运营连续性。
   
  每个IT经理都想防范和阻拦潜在的事故——无论是简单的服务器宕机还是灾难性事件,但除了正确的技术、人员、工艺和过程,各机构必须确保拥有有效的业务连续性计划,以保证机构的正常运转,这包括突破传统界限来确保信息总是安全、可用的。
   
  只有把所有的零件正确连接在一起,整个系统才能工作。在IT安全团队和IT操作团队之间经常存在一堵看不见的“沉默墙”(Wall of Silence),但为了让IT机构能实现全面理解、行动和控制,必须拆掉这堵墙。
   
  实际上,要想更广泛的观察整个公司运作,IT部门必须更好、更经常地与整个公司进行沟通。创建一个由IT部门、公司法人和业务经理组成的管理委员会将会大大帮助企业建立并保持对业务连续性的理解和优先级划分。
  
  来源:《信息系统工程》
  
0
相关文章