不打无准备之仗
对于IT项目负责人来说,一个全新项目的上线挑战性极大,如果不做好全方位的准备,没有考虑周全各种潜在的风险,以及没有将系统调试到非常好的状态的话,新项目初次上线往往会面临非常多的麻烦。
2006年7月,第一期电子式储蓄国债在全国范围联网销售,就遇到个让系统管理人员措手不及的大麻烦。
由于是首次发行新型的电子式国债,而且数量有限,吸引了全国众多的购买者,在全国各地,购买者从开售当日一大早就排起了长队,场面十分火热。但是开售没多久,多家银行系统出现故障,购买者无法登录购买电子国债,有些银行销售系统由于长时间中断从而错过这短短几个小时的销售,更是让苦苦等候多时的购买者空手而归。
此次国债全国代办网点一起通过财政部的系统抓数,代理银行不受数量的限制,各地投资者先购先得,售完即止。正因为这样,对各地银行的系统提出了很高的要求,一旦系统出现问题,就无法满足当地购买者的需求。中国银行、中国农业银行(下称农行)以及交通银行(下称交行)都出现了不同程度的系统故障,农行系统中断长达5小时,而交行一些支行不但无法办理购买国债业务,甚至连储蓄等其他业务也无法办理了。
中央国债登记结算有限责任公司则表示,国债公司发行系统端一直保持正常,而且此次发售国债数量远未达到系统负载峰值。问题出在哪里?业内人士认为,目前许多银行都在自行开发系统,各银行间开发水平有差距,加上电子国债属首次发布,又是随机抓取机制,这其中系统连接的带宽限制与短时间内海量数据的处理对销售系统来说都是极大的考验。如果之前不做好充足的风险压力测试以及连接准备,的确很容易出现问题。
这次事件之后,到10月发行第二期电子国债时,中国工商银行下属一支行表示,第一期国债发行时系统不稳定,导致很多客户买不到国债,到第二期时,该支行所有窗口都可以办理电子国债业务,分散了客户的流量,系统运行也非常顺利。
看来,在接受了一次教训之后,各大银行也都有了经验,想出各种应对措施,努力打好有准备的仗。
“有备”不一定无患
IT的集中管理往往被看作是解决信息孤岛、提高运行效率的有效手段。然而集中之后的IT系统“牵一发而动全身”。因此在集中之时,还需要多留一手,不仅仅是建设备份系统,也要真正用好备份系统。典型的案例发生在2005年10月,中国民航信息网络股份有限公司(下称中航信)的主机故障导致全国数个机场航班延误。
从10月10日13点32分起,由于中航信离港系统的主机出现技术故障,导致广州白云机场、深圳机场、北京首都机场等机场的离港航班受到影响,出现不同程度的延误。事故发生后,部分机场启动了自主开发的离港备份系统,并且采用人工方式为旅客办理登机手续及行李托运手续。当天14点16分,中航信离港系统恢复正常,但是影响直到晚上才逐渐消除。
在中国,绝大部分机场的离港系统都由中航信提供,实行数据集中管理。这种集中管理保证了全国所有机场的离港业务在标准以及操作规范上的统一,但同时如果中航信的系统发生了故障,则很容易波及到多个机场。事实上,中航信的离港系统发生故障并不是第一次。今年1月11日,由于中航信位于北京总部的服务器出现故障,就曾经造成成都双流机场离港系统“瘫痪”近40分钟。这种故障是不可避免同时也是不可预料的,因此建设一个完善的备份系统和备份制度就显得必不可少。
在航空这个高度依靠信息技术的行业,灾难备份系统的建设并不落后,在这次中航信的系统故障中,各地机场也同时启用了备份的离港系统,但航班延误的情况仍然较为严重。据某航空公司人士透露,此次虽然受影响的机场都切换了备份系统,但由于许多数据仍然需要与北京进行传送,这中间可能出现了很多信息错误的情况,使得备份系统的作用没有充分发挥。由此可见,备份系统不应该是“备而不用”,不是建设了备份系统就能高枕无忧,围绕备份系统切换的一整套流程同样需要保证万无一失,否则“有备”也并不一定能够无患。