信息化 频道

数据仓库:商业智能的基础

  

  对于一个企业来说,最关键也最为重要的是,如何以一种有效的方式逐步整理各个业务处理系统中积累下来的历史数据,并通过灵活有效的方式为各级业务人员提供统一的信息视图,从而在整个企业内实现真正的信息共享。数据仓库技术正好满足了这一需求。数据仓库是商业智能系统的基础,如果没有数据仓库,没有企业数据的融合,数据分析就成为了无源之水。

  数据仓库主要有四个重要特征:

  1、数据仓库是面向主题的。传统的操作型系统是围绕公司的应用进行组织。如对一个电信公司来说,应用问题可能是营业受理、专业计费和客户服务等,而主题范围可能是客户、套餐、缴费和欠费等。

  2、数据仓库是集成的。数据仓库实现数据由面向应用的操作型环境向面向分析的数据仓库的集成。由于各个应用系统在编码、命名习惯、实际属性、属性度量等方面不一致,当数据进入数据仓库时,要采用某种方法来消除这些不一致性。

  3、数据仓库是非易失的。数据仓库的数据通常是一起载入与访问的,在数据仓库环境中并不进行一般意义上的数据更新。

  4、数据仓库随时间的变化性。数据仓库中的数据随时间变化的特性表现在三个方面:

  1)数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。操作型系统的时间期限一般是6 0~9 0天,而数据仓库中数据的时间期限通常是5~1 0年。

  2)操作型数据库含有“当前值”的数据,这些数据的准确性在访问时是有效的,同样当前值的数据能被更新;而数据仓库中的数据仅仅是一系列某一时刻生成的复杂的快照。

  3)操作型数据的键码结构可能包含也可能不包含时间元素,如年、月、日等;而数据仓库的键码结构总是包含时间元素。

  OLAP:海量数据分析利器

  对于TB级的海量数据,联机分析处理OLAP无疑是一种有力的数据分析工具。它可以让管理者灵活地对海量数据进行浏览分析。利用多维的概念,OLAP提供了切片、切块、下钻、上卷和旋转等多维度分析与跨维度分析功能。相对于普通的静态报表,OLAP更能满足决策者和分析人员对数据仓库数据的分析。

  区别于传统的联机事务处理 (OLTP)系统,OLAP有12条准则:

  1、 OLAP模型必须提供多维概念视图

  2、 透明性准则

  3、 存取能力推测

  4、 稳定的报表能力

  5、 客户/服务器体系结构

  6、 维的等同性准则

  7、 动态的稀疏矩阵处理准则

  8、 多用户支持能力准则

  9、 非受限的跨维操作

  10、直观的数据操纵

  11、灵活的报表生成

  12、不受限的维与聚集层次

  虽然随着技术的发展,部分准则有所突破,但这些准则仍然是OLAP技术的基础。

  OLAP系统架构主要分为基于关系数据库的ROLAP(Relational OLAP)、基于多维数据库的MOLAP(Multidimensional OLAP)、基于混合数据组织的HOLAP(Hybrid OLAP)三种。前两种方式比较常见。ROLAP表示基于关系数据库的OLAP实现。它以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。MOLAP表示基于多维数据组织的OLAP实现。它以多维数据组织方式为核心,使用多维数组存储数据。MOLAP查询方式采用索引搜索与直接寻址相结合的方式,比ROLAP的表索引搜索和表连接方式速度要快得多。

0
相关文章