信息化 频道

将安全进行到底

紧急输血

      在中山二院的岭南楼和距其不远的另一座大楼里,两套磁盘阵列系统遥遥相对、互为呼应。这是2007年初刚购置的容灾系统,岭南楼计算机房里的为主阵列,另一套则是备阵列,彼此间通过容灾系统可以实现同步容灾复制,应用系统在两台阵列上的数据在任何时候都完全同步。如果主阵列发生灾难性的数据损坏,相关软件就可以把应用系统自动切换到备机阵列上运行。
      IT系统瘫痪的概率非常小,有必要建立投入动辄以百万元计的灾备系统吗?这也曾是中山二院领导层的困惑。2004年,如今的院信息中心的主任牛启润就已撰文《浅谈医院信息系统机房安全策略》,呼吁灾备系统对医院的重要性。之后做出一个整体计划上报院领导,但未获批。

      转折点发生在2005年11月23日上午9点多,中山二院的门诊系统突然瘫痪。每天上午来这里看病住院的约4000人,而当时正值最高峰期,整个医院立即乱成一锅粥。因为是在正常工作一段时间后出的问题,结果是有的医生在电脑上开了电子处方,病人在药房拿不了药;有的病人挂了号,医生没有办法接诊;有的病人交了费拿不到药;病人看不到医生开的处方,整个天,医院所有的行政职能部门都下去维持秩序。

      幸好,这个状态只持续了1个多小时。当行政人员出面向病人解释、道歉时,信息部门的人却没有露面。狼狈不堪的他们并非有意躲避,而是一直在紧张地处理问题。这段经历也成为牛启润从业以来最被动的一次。肇事者是数据库。原本中山二院也做了容灾方案,但他们做的是传统的集群解决方案“2+1”模式,即两台服务器连接到一台磁盘阵列,这实际上也是一种安全措施,因为两台服务器实现了双机备份。但这意味着当单台磁盘阵列成为核心系统的故障点时,整个系统将发生停机或瘫痪,虽然说应用出问题的时候,系统可以不停。“其实之前我已经考虑到了这个问题,但是没想到会落到我们头上!” 牛启润喟叹道,因为原本数据库出故障的几率并不高,没想到就让他们摊上了。
      创建于1835年的中山二院,是我国第一所西医院,孙中山先生曾在此学习。传统的积淀并不能阻挡其采用先进IT技术的脚步。1997年,中山二院的信息系统就已投入使用,其中的门诊、住院、检验,这与患者就医最密切的3大系统的稳定性则是重中之重。目前,这三个系统每年大约产生100GB的数据。“门诊这种系统的停机最长不能超过5分钟”——这是牛启润的一个底线。但这次事故,彻底击毁了牛启润辛苦构筑的信息安全系统。
      祸兮福之所倚,这件事之后,那份没有获批的建立灾备系统的计划书很快就通过了。
      经过半年的调研,比较了IBM、EMC、HP、华为3com等公司的产品后,中山二院最终选择了两台EMC CLARiiON CX3-20,实现异地备份。“一旦发生类似于2005年那样的事故,灾备系统能在一分钟内起来,并且数据不会有任何丢失。”牛启润说。

 

0
相关文章