信息化 频道

信息系统如何“进补”不再脆弱?

    【IT168 专稿】11月11日中午,杭州萧山国际机场离港信息系统网络出现故障,直至下午1点40分,系统才恢复正常。这一事故造成10余航班延误,1000余名旅客滞留机场。10月10日,首都机场离港系统就出现过类似故障,导致84个离港航班延误。白云机场直接受影响的航班有20多个。
 
 
    11月11日的故障,冲击范围几乎遍及全国。13时28分,“离港系统”故障直接影响到福州长乐和厦门机场。13点30分~14点35分,长乐机场至北京、香港、兰州的三趟航班分别延误50至90分钟,近200名乘客被滞留。而厦门高崎机场13点32分~14点30分,就有22趟航班的1900多名乘客改签或延时登机。
 
信息化让社会脆弱
 
    机票电子化以后,一旦网络出现故障,登机作业只得全部中断。“使用纸质机票时,离港系统出现障碍曾有应急机制,工作人员能手工给旅客办理登机手续。而机票电子化后完全是数字作业,一旦故障,引发的连锁反应人工无法控制。”在电子客票刚刚全面推广时,一位业内人士担忧地说。
 
 
    而随着机票电子化和离港信息系统的应用越来越深入,系统障碍的出现已经不再是第一次,而且远非最后一次。中国航信离港系统的可靠性问题,值得高度关注。
 
    信息化程度的提高,的确带来了服务便捷;然而,也使社会生活变得脆弱。11月从杭州引发的离港故障在2~4分钟内就传递到上千公里的异地;甚至发生“次生”故障。因而,我们要从多方面、多思路考虑应急和安全问题。
 
    如果是办理行政业务手续,信息系统故障顶多使客户返回,改日再来或是另择他地办理。但是,面临证券、金融、保险、医疗服务或其他紧急经济活动时,系统延误可能会带来重大损失或令用户遭遇“人命关天”的境况。因此对于民航、出入境这样的大规模旅客活动,也要有相应的紧急措施。
 
    以前,信息系统的安全仅限于系统安全本身,解决方案不过是以备用设备来“顶替”。但是,随着系统越来越复杂,像微软那样每天发布“补丁”的方法已经令漏洞防不胜防。

“并行”填补漏洞

    现代的服务应急系统应当推出不同思路的“并行系统”——在系统故障时,允许快速调用备用服务数据,改为人工作业或人工辅助作业。为了保障系统安全,可采用各种高可靠性技术、备用技术保证系统安全运行;而一旦发生故障,应急系统的重点则应利于随时调阅数据,保证人工作业不间断,同时尽快恢复主系统。
  
    早在1964年,中国的第一台晶体管计算机441-B就设置了监控检查指令和检查程序,并且发挥了应有的作用。今后,随着传感器的小型化、智能化发展方向,完全可以使其对系统的关键器件甚至流程进行“系统外”的行为监管——只要系统的传输流量、器件温度、存取操作等出现异常,传感器即可敏锐地捕捉到信息,及时发布告警和予以处置。
 
    另一思路是,在通信系统的支持下,运用传输手段使数据以“分布”方式快速落地。北京联通已经创新地利用短信控制的方式——一旦行业用户网络出现故障,控制中心立即利用网中广播站进行短信告知,并控制拨号程序,有效避免了网络故障后大量同时拨号造成的网络拥塞。
 
    在机场,一种可能性是设立独立于主系统的“暂存系统”,随时跟踪即将登机的旅客动态,并滚动记录其资料。一旦系统发生故障,该暂存系统可以独立提供数字信息或文字资料。根据机票参数,减化手续自动给出关联的登机座位。在系统恢复之后,还要将“应急作业”的数据“回填”,保证系统管理持续不间断。
 
    另一种方法就是通过移动电话应急。设想某日,民航登机系统又出现故障,一架正待出港飞机的1000多位旅客的手机中都收到登机航班和座位信息,在安检之后,旅客们井然有序地手持移动电话逐一接受扫描领取登机牌;这时,仅有9位旅客因为手机电源等原因地等候在服务台办理身份证实,还有2位旅客手机丢失在宾馆和出租汽车、1位旅客手机被窃正在向机场警务站挂失,而大部分旅客的正常乘机得到了保障。
 
 
    信息化社会,故障不可避免,而及时找到替代的办法才是“应急”的宗旨。
0
相关文章