信息化 频道

深度开发信息资源的思考与实践

  2.数据存储与管理
  是整个系统的核心。基于数据源,按照业务分析主题(如:销售、库存或财务等)对业务数据进行重新组织(抽取、清理和集成),形成数据集市(DataMart),确定其物理存储结构;同时组织存储相应的元数据(包括数据字典、记录系统定义、数据转换规则、数据自动加载频率以及业务规则等)。最终形成的数据仓库按"星型结构"模型(事实表+维度表)依然建立在关系型数据库(RDBMS)上。数据仓库中对数据的管理工作包括数据的安全、维护、备份、恢复、归档等。
   

  3.OLAP服务器
  对分析需要的数据按照多维数据模型进行再次重组(多维建模),形成多维数据立方体结构(Cube)。以支持用户多角度、多层次的分析数据。其具体实现方式有:ROLAP、MOLAP和HOLAP。ROLAP中基本数据和聚合数据均存放在RDBMS中;MOLAP中基本数据和聚合数据均存放于多维数据库(MDD)中;而HOLAP中基本数据存放于RDBMS中,聚合数据存放于多维数据库中。
   

  4.前端工具与应用
  数据立方体中的数据经处理后,多维地展现给用户。前端工具主要包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库开发的应用。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具既针对数据仓库,同时也针对OLAP服务器。
   
   

  多维分析系统构建案例:
  在实际构建中,可用Oracle9i搭建数据仓库,MicrosoftAnalysisService2000搭建多维数据库,ProClarity6.0作前端工具构建多维分析系统。
   

  3.知识提炼---高端信息开发
  针对分析和预测问题,源数据经过清洗和转换等成为适合挖掘的数据集。通过DM(DataMining,数据挖掘)选择一种或多种挖掘算法(模型),提炼出数据集背后蕴涵的规律(知识),这些规律可用来辅助决策。
  针对问题类型可利用的挖掘算法如表1所示:

  关联规则挖掘案例:
    美国的超市有这样的系统:当你采购了一车商品结账时,售货员扫描完了你的产品后,计算机上会显示出一些信息,然后售货员会友好地问你:我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗?
  

  这句话决不是一般的促销。因为,你的购物车中有餐巾纸、大瓶可乐和沙拉,则系统算出86%的可能性你要买一次性纸杯。结果是,你说,啊,谢谢你,我刚才一直没找到纸杯。  
   

  每天,新的销售数据会进入系统,与过去N天的历史数据一起,被关联规则挖掘模型处理,发现当前商品之间的关联及关联强度。
   
   

  综上所述,固定报表系统已经不能满足日益增长的深层次信息需求了。以数据仓库及相关技术(OLAP,DM)作为解决上述难题的主要技术手段,通过建立DSS(DecisionSupportSystem,辅助决策支持系统)实现信息资源从数据到信息和知识的深度开发和利用。
   
   

   二、DSS的实施策略
  1.DSS的位置
  数据仓库是面向数据应用的数据管理技术,它提供了集成化、历史化的数据管理功能,支持综合性的数据分析。结合应用各类工具(OLAP、DM、前端展现等)构成DSS,以加强管理并辅助战略、战术决策。
  在企业信息化建设中,辅助决策支持系统处于高端应用,与其它系统的相对位置如图3所示:


图3DSS处于高端应用

0
相关文章