一、前言
当前竞争激烈的市场环境,使企业每天都面临着来自信息数据方面的严峻挑战,归纳来讲就是,既要提供高度的应用与数据可用性,同时又要限制成本费用,而且,随着数据中心的日益扩展,其中包括异构的操作系统,多种硬件部件和许多个节点、站点,上述挑战也变得更加错综复杂。
为了使数据——这种企业最有价值的信息,安全地、高可用地、可恢复地存在于企业影响范畴内,数据的可靠存储与备份管理工作就显得尤为重要。面临企业各种重要数据分布在多个分散平台和数据库中的状况,全面的数据保护计划将可以实现所有平台、站点、应用和数据库的易管理性、安全性、可扩展性,从而减少或消除数据丢失引起的业务中断,同时还能缓解IT部门面临的复杂性挑战。
本文下面的部分将就数据存储备份领域,业界较为通用的架构方式进行讨论,旨在交流一些实际方案实施过程中的一些心得体会。
二、正文
网络存储(NAS)解决方案
方案适用性
NAS(Network Attached Storage—网络连接存储)和下文将要提到的SAN(存域网)的出现适应了信息时代三种重要的发展趋势:
1、 Internet正在成为主要的信息处理模式;
2、 需要存储在各种介质中的数据量较之以往大大的增加了;
3、 数据作为企业的生命和核心竞争力的重要性日益增加。
NAS会在企业的LAN上占有一个属于自己的节点。在这种架构环境下,利用一台服务器处理网络上的所有数据,将负载从应用服务器或企业服务器上卸载下来。所以可以说NAS是一种Ethernet和SCSI的即插即用存储技术。
NAS架构所涉及的设备一般包括存储器件(例如磁盘阵列、CD或DVD驱动器、磁带驱动器或可移动的存储介质)和集成在一起的简易服务器,可用于实现涉及文件存取及管理的所有功能。
NAS设备一般支持多计算机平台,用户通过网络支持协议可调用相同的文档,因而,设备无需改造即可用于混合Unix/Windows NT局域网。而且,NAS设备的物理位置非常灵活,通过物理链路与网络连接。
NAS设备无需应用服务器的干预,允许用户在网络上存取数据,这样既可减小CPU的开销,也能显著改善性能。
NAS即将存储设备通过标准的网络拓扑结构(例如以太网),连接到一群计算机上。NAS是部件级的存储方法,它的重点在于帮助工作组和部门级机构解决迅速增加存储容量的需求。需要共享大型CAD文档的工程小组就是典型的例子。
方案简介
NAS将存储设备连接到现有的网络上,提供数据和文件服务。NAS服务器一般由存储硬件、操作系统以及其上的文件系统等几个部分组成。简单的说,NAS是通过与网络直接连接的磁盘阵列,它具备了磁盘阵列的所有主要特征:高容量、高效能、高可靠。NAS将存储设备通过标准的网络拓扑结构连接,可以无需服务器直接上网,不依赖通用的操作系统,而是采用一个面向用户设计的、专门用于数据存储的简化操作系统,内置了与网络连接所需的协议,因此使整个系统的管理和设置较为简单。其次NAS是真正即插即用的产品,并且物理位置灵活,可放置在工作组内,也可放在其他地点与网络连接。因此,用户选择NAS解决方案,原因在于NAS价格合理、便于管理、灵活且能实现文件共享。
存域网(SAN)解决方案
方案适用性
SAN(Storage Area Network—存储区域网络)架构中的设备,包含数据路径、交换机配置和拓扑结构、存储设备、RAID控制器、高速缓存和其他硬件对应用来说将彻底变成透明的,存储和存储网络的物理特性通过使用SAN存储区域网络设备提供的智能化管理对操作系统来说也变成透明的。SAN存储区域网络设备处于主机和存储池之间,让信息技术领域的专业人员可以迅速地将存储虚拟化和建立逻辑单元,也可以通过一个单一的设备接口来执行所有的必要的管理,从而可以提供全部的存储区域网络的卷管理功能。
其优势在于以下七个方面:
首先,SAN是构建在存储器接口上的,使存储资源能够被构建于服务器之外,这样,多个主机服务器就能够在不影响系统性能或主网络的情况下分享这些存储资源,也就是SAN能将LAN上的存储转换到由存储设备组成的SAN上,使得数据的访问、备份和恢复不影响LAN的性能,在有大量数据访问时,不会大幅度降低网络性能。在传统的集中式备份解决方案依赖IP网络作为其数据路径。这样,仅传输的数据量就会使带宽处于饱和状态。结果就使得计算机的带宽远远不能满足需求。
第二,可扩展性,由于在SAN中存储系统和服务器之间是通过FC集线器或存储交换机进行连接的,这样使得存储系统的扩展非常灵活,能符合用户不断增长的海量数据存储的需要。
第三,容错能力、高可靠性和高可用性,SAN中的存储系统通常具备可热插拔的冗余部件以确保可靠性。
第四,管理的方便性,集中式管理软件允许远程配置、监管和无人值守运行。
第五,支持异构服务器,UNIX、NT和NetWare服务器可同时连接。
第六,SAN的互连设备是通过高带宽光纤通道连接的,数据的吞吐量为100M/sec,从距离上,与传统的SCSI相比它支持连接的能达到10公里,而SCSI最长为25米。
第七,能够有效地减少总体拥有成本(TCO)。
方案简介
SAN的整个结构可采用了高速的光纤技术,这样就大大提高了数据传输速度。并且,在整个结构中做到了服务器与存储系统之间的真正隔离,这样现实了整个结构中存储系统被所有的服务器共享,实现跨平台的支持,使得在同一个环境中NT、UNIX、Netware等异构平台共享存储。另外,它避免了传统的SCSI盘阵连接节点数及节点间距离的局限性。同样,使得存储系统的集中管理得已实现。
其次,架构中涉及的每台服务器到存储系统的数据通道可采用冗余的设计理念,当其中一条数据访问路径发生故障时(包括:从服务器到光纤交换机、光纤交换机及光纤交换机到存储系统),系统会将当前的数据流通过另一条冗余的路径进行数据提取。从而,避免了系统的单点故障,而造成应用服务器不能提供连续的数据服务。大大地增强了系统的高可用性和高可靠性。
SAN是构建在存储器接口上的,使存储资源能够被构建于服务器之外,这样,多个主机服务器就能够在不影响系统性能或主网络的情况下分享这些存储资源。也就是SAN能将LAN上的存储转换到由存储设备组成的SAN上,使得数据的访问、备份和恢复不影响LAN的性能,在有大量数据访问时,不会大幅度降低网络性能。在传统的集中式备份解决方案依赖IP网络作为其数据路径。这样,仅传输的数据量就会使带宽处于饱和状态。结果就使得计算机的带宽远远不能满足需求。目前,针对不同的应用场合,可以使用不同的备份软件。例如,Solstice Backup、Netbackup等等。它们均能实现自动的定期备份,甚至能实现Global Manage。
建设一个企业存储区域网络(Storage Area Network,SAN)将包含了许多相对复杂的技术。归纳而言主要有三:网络互连结构、管理软件和存储系统。为了得到非常好的的实际应用和现有应用程序的无缝支持,规划和集成将显得格外重要。
数据备份解决方案
能够解决企业数据安全恢复方面实际问题的备份方案,必须与企业现行数据存储方案相互协调,只有如此,才能从根本上有效的解决因人为误操作、软硬件故障、病毒危害、黑客恶意攻击和偶然性的自然灾害所造成的数据危险性问题。
数据的价值已经越来越为人们所重视,在数据爆炸性增长的今天,“数字化生存”观念已为人们接受,人们越来越感觉到自己的生活和工作与计算机中数据的紧密联系,将越来越依赖这些数据,于是,如何保证数据的完整性成了信息化社会的一个关键问题。
方案简介
备份是一种数据安全策略,是将原始数据完全一样地复制,严格来说应复制两份,保存在异地。在原始数据丢失或遭到破坏的情况下,利用备份数据把原始数据恢复出来,使系统能够正常工作。数据备份的正常进行需要有软件和硬件的支持。
在备份硬件方面,对拥有大量重要数据而且这些数据又在不断增长的用户来说,近几年磁带库越来越多的成为他们的选择。所谓磁带库,是将多台磁带机、多盘磁带、存放磁带的智能机械臂系统和磁带库管理、控制、监测、诊断系集成在一个箱体里。
使用磁带库作为自动存储解决方案有如下优点:
1. 存储容量大。由于磁带库中有多盘磁带,所以磁带库的在线容量为n倍的单盘磁带容量。这对一个或多个备份作业其数据量大于单盘磁带容量的情况来说,可以实现自动换带,不需要系统管理员来人工更换磁带;同时磁带库的大容量加上磁带的轮换使用,使用户在几个月甚至一年内不需要打开磁带库的门来更换磁带。
2. 速度快。由于磁带库中有多台磁带机,所以数据备份、恢复、查询速度相应提高了数倍。同时多台磁带机可互为冗余,提高磁带库的可用性。
3. 全自动操作。结合专业备份软件,根据系统管理员的设置,可以完成定时、定文件、定目录、定数据库的自动备份任务,做到无人值守。通常把备份作业时间设定在系统网络负荷最轻的深夜或凌晨来进行。全自动操作还包括磁带库的自动诊断、感应、识别、恢复或报警以及磁带库自动日常维护和磁带机自动清洗等。
4. 备份数据更安全。由于磁带库有机械锁和软件锁双重保护,使不相关的人员根本无法接触到磁带,从而确保备份磁带的安全性。同时由于减少了人工磁带管理工作,避免了磁带搞混、丢失或错误处置。
在备份软件方面,通过采用多层次结构(如“主备份服务器——介质备份服务器——客户端备份服务器”的三层结构体系)的备份系统,用户可灵活的根据服务器系统和整个系统成本来选择相应备份服务器平台,而主流的备份软件一般都会提供灵活的多平台支持,并可以提供多种数据库热备份Agent。此外,这种三层结构的形式可以很方便的实现系统实时方面的灵活性和可用性。

三层架构图示
(e-works)