信息化 频道

上交所用预警系统抓“危险分子”

  【IT168 专稿】2006年末,国内的股市一反疲态牛气冲天,上海证券交易所(以下简称上交所)日均交易量飙升,已高达500多亿元。在这片数字浪潮中,上交所的数据仓库系统大放异彩。按照每笔交易平均12000元计算,500亿元需要处理400多万笔交易,交易笔数之高让伦敦证券交易所相形见绌。而如此多的交易数据,仅需半个小时就可存入数据仓库。

从数据仓库“挖”到财务预警

  1990年11月底成立的上交所,16年来积累了大量的交易历史数据,为有效提高决策支持水平、市场监管水平和服务水平,于2002年启动了数据仓库两期项目。在上交所工程师郑斌祥看来,数据仓库的最大优势在于,它可通过单一视图提供深入细致的信息,帮助上交所从数据分析中发现风险的苗头,进而采取主动的防范措施。

  从2002 年到2005年,上交所完成了两期数据仓库的规划、设计、实施与运行,仅2002年完成的第一期项目就为15个业务部门提供了200多项应用。

  众所周知,证券监管、防范交易欺诈是上交所的重要职能,相关的分析工作涉及许多纸质文件。但很少有人知道,这些纸面文件必须保留20年,时间长了,纸质文件容易破损,降低乃至丧失法律效力。因此,对非结构化数据的处理成为数据仓库的要务之一。如今,上交所已经完成了包括600万页纸质非结构化数据在内的十几个TB数据的清理工作。
 
  股民也许并不清楚也不关心这些数据的意义,他们更关注的是如何找到股市黑马,从而捞上一票。但对证券公司而言,如何通过这些数据尤其是上市企业的财务报表,判断上市企业的财务风险,从而保护股民利益却至关重要。

  财务风险的终极表现就是公司破产,无能力履行债务偿还责任。从企业财报数据入手,运用数据挖掘方法,构建上市公司财务风险预警模型,预测可能出现财务风险的上市公司,对于投资者及时调整投资决策、监管层准确识别盲目融资公司、投资银行有效发掘潜在客户都具有重要意义。这也是数据挖掘的价值所在。

  于是,在建设数据仓库的同时,上交所找到了原IBM全球银行数据挖掘咨询组组长刘世平,委托他新成立的公司——吉贝克信息技术有限公司,负责该项目设计阶段的数据挖掘咨询工作。

  吉贝克于2002年12月进入项目组,由刘世平亲自带队。凭着丰富的数据挖掘项目实施经验,咨询团队仅花了一个月的时间,就完成了数据挖掘战略文档的撰写工作,并向上交所提交了18个数据挖掘主题及其解决策略的分析。吉贝克的效率与能力给上交所留下了深刻印象,它随即又获得了上交所的下一个项目——建立上市公司财务指标预警系统。

0
相关文章