信息化 频道

CIO进行数据恢复应准备面对各种威胁

  【IT168 信息化】

  企业如何保证系统恢复时能达到设定的RTO和RPO?首先应该合理安排恢复计划。为了确保数据和应用程序受到适当保护,企业需要分析IT服务对其业务的影响,然后再根据这些服务对于业务的重要性对其进行分类。

  虽然现在大多数企业都认识到了容灾对于保证企业业务连续的重要性,但是,很多情况是,一旦灾难发生,即使企业建有容灾系统,其IT系统也未必就能恢复运行。来自赛门铁克的调查数据显示,被调查者对自己企业的大概恢复操作成功率进行估计时,答案是平均恢复尝试成功率只有83%。当灾难来临时,企业往往发现,他们对某些关键任务IT服务的保护力度不够,原因包括对停机的实际成本估计不足,尽管采用了新技术,但还是无法重新达到恢复时间和恢复点目标,以及无法识别系统正常运行所面临的各种威胁。

  企业如何保证系统恢复时能达到设定的RTO和RPO?首先应该合理安排恢复计划。为了确保数据和应用程序受到适当保护,企业需要分析IT服务对其业务的影响,然后再根据这些服务对于业务的重要性对其进行分类。业务影响分析有助于确立恢复服务级别,而应用程序通常是根据自身的重要程度加以分层的。无论是哪一层,企业都必须要考虑不同的挑战,以确保实现非常好的恢复解决方案。其次,在保护各层应用程序时,企业通常会面临着恢复成本高、存储容量管理不善、操作效率低下、灾难恢复自动化程度不够、缺乏灾难恢复测试、备份时间延长、采用服务器虚拟化等新技术带来的复杂问题的挑战。因此,企业要制定出有效的恢复战略。对此赛门铁克推荐了以下三项战略,以应对各种挑战。

  一是确保应用程序的可恢复性。IT服务的核心在于应用程序。由于企业依赖IT服务来处理关键业务,因此要求应用程序的恢复时间越来越短。2008年,关键任务应用程序的RTO已从9小时骤减到4小时。但是,保持复杂应用程序环境的可用性并对其进行快速恢复并非易事,赛门铁克推荐用户采用能提高可靠性和恢复速度的解决方案。

  二是自动执行应用程序恢复。要实现快速、安全的恢复,赛门铁克建议自动执行应用程序恢复,以实现本地高可用性以及全球灾难恢复。这样可防止各种中断(从服务器发生故障到整个站点发生故障)对业务的影响。赛门铁克公司容灾技术专家毛立峰表示,与传统的手动恢复流程相比,自动切换方法可以消除大量的停机时间。为了保护包括数据库、应用程序服务器以及Web服务器层在内的整个应用程序环境,赛门铁克提供的Veritas Cluster Server对这些组件间的相关性进行了了解,并对整个 IT服务在任何层发生故障的情况下进行的启动予以协调。

  三是加快应用程序恢复速度。将恢复时间缩短到数分钟乃至几秒不仅异常困难,而且成本高昂,不过,赛门铁克的解决方案可以显著缩短恢复时间。借助 Storage Foundation Cluster File System,高可用性集群中的服务器可以并行访问同一个存储。这意味着故障转移期间无需重新启动存储资源,因此,恢复速度显著提高,故障转移速度比一般高可用性集群快了90%。

  对于已经建成的容灾系统,当灾难来临时它是否能够按照要求将生产系统切换到容灾系统,当然最有效的办法是进行容灾恢复演练。不过,恢复演练的成本很高,不是所有企业都能承受得起的。在赛门铁克进行的一项灾难恢复调查中,IT经理表示,有40%的灾难恢复测试影响到了客户,有27%影响到了收入。因此,近30%的企业一年中完成的测试不超过一次。

  毛立峰介绍说,为了确保灾难恢复解决方案奏效,赛门铁克的容灾解决方案中集成了无中断灾难恢复测试,用这样一个工具,用户就可以模拟演练,而不影响生产。模拟演练可以对主机配置、存储配置以及数据库配置进行模拟,及时发现容灾系统与生产系统不一致的地方。

0
相关文章