推广“必需品”
上证所的海量数据被整理到数据仓库中之后,对白硕等人而言,关键工作才开始。在项目实施的过程中,项目组就向上证所各业务部门,如交易管理部、会员部、上市公司部、市场监察部、债券基金部等发出邀请,让他们提需求。“我们必须坚持业务先导的应用原则,数据仓库才能成为一个必需品。”白硕说。
最初,12个业务部门都提出了自己的应用要求,不过那时它们都是抱着试试看的态度。但当项目进行到一半时,业务部门不约而同地发现自己的工作要求正在通过数据仓库逐步实现;之后,他们提需求的热情高涨多了。“项目每进行到一个阶段、一个部门时,都会产生一些应用成果,只有我们的成果得到了业务部门的认可,他们才会更加配合我们的工作,也才会产生更多的成果。我们把这叫做‘沿途下蛋’。”白硕说。高高在上的数据仓库开始在上证所归位。
如今,粗粗算来,上证所数据仓库项目组已经开发出了559项功能强大的应用。例如,针对上市公司报送的财务报表,他们开发了一个财务预警模型:利用这个模型,通过分析上市公司各种财务报表之间的勾稽关系,可以判断出该上市公司报送的数据是否真实可靠。如果初步判断报表是真实的,再通过进一步的数据挖掘,还可以分析该上市公司的财务状况存在哪些问题,并通过直观图形化的方式反馈给监管部门。最终,通过对上市公司每个季度、每年数据的比较分析,上证所就可以建立起上市公司的诚信数据库。“当然,现在的难点是上市公司风险特点在不断地变化,因此这个模型需要每年甚至每半年就要做一次调整。”上证所新信息系统项目组副组长、信息中心副总监皮六一说道。如今,上证所正在尝试与中国人民银行的征信系统联接,从而能够将更多领域的数据汇总起来,尽快掌握上市公司的最新情况,更加有效地化解金融风险。
在支持业务部门的日常工作之后,项目组又开始利用数据仓库为上证所的业务创新提供帮助,在上证所的股票期货、权证、国债买断式回购、ETF(交易型开放式指数基金)等新交易品种背后,都有数据仓库的身影。
在设计ETF时,业务部门需要评估ETF的套利状况,这需要建立一套复杂的套利行为识别模型。如果业务部门自己开发这套模型,费时且费力。这正好给了白硕与业务部门“拉近”关系和显示数据仓库威力的绝好机会。于是,项目组在数据仓库的基础上,针对ETF专门开发了一个套利模型,能够根据不同业务部门的要求,按照不同的类别(如账户、投资者类型、交易所会员)进行汇总分析。之后,他们又花了1个月向业务部门推广他们的这个套利模型。业务部门发现,以前他们需要花很多时间、编几千行程序开发的模型,现在只需把需求告诉数据仓库项目组,马上就能拿到为自己量身定制的套利模型。“从那以后,不用我们出去推广,很多业务部门开始自己找上门来了,而且一个比一个积极。”皮六一说道。
2005年2月,上证50ETF如期推出,这也是国内第一个ETF产品。有了这次经验,上证所随后的权证设计只用了不到半个月。如今,这些创新金融产品都受到了投资者的热烈欢迎。“有了我们的支持,业务部门的定位已经发生变化,他们不需要再去考虑数据模型等底层工作,从而可以把精力集中在业务创新、市场分析等更高层次的事上了。”皮六一认为。
前不久,上证所完成了数据仓库的二期建设并投入试运行。据负责项目实施的NCR Teradata数据仓库事业部大中华区专家中心总经理杨顺生介绍,一二期总体的系统容量有14TB(万亿字节),在整个亚太地区金融行业中排名第二。(IT经理世界)