信息化 频道

从IT架构认识BI系统

【IT168 信息化】BI(Business Intelligence)一词是由Howard Dresner在1989提出的,用来描述一种透过特定的概念与方法,让企业制定决策时能立基于事实基础之上。 

 

    为了实现这个目标,软件商各自发展出BI的解决方案,实现的技术各有擅长,但简单而言,便是从搜集数据、整理数据、分析数据的过程,最终再呈现给分析人员。每经过一个步骤,资料数据就好像经过粹练一样,更具价值。

    从IT系统的角度而言,广义的BI包含了ETL工具、数据仓库(或数据超市)、在线实时分析引擎和动态报表工具。底下我们将从BI架构分析各组件的组成。

ETL工具

    ETL是将数据进行撷取、转换与加载的过程,数据撷取必须从不同的数据库、应用程序,甚至是非结构化的文件,取得数据来源;转换则包含了像是格式转换、数据加总、合并或是过滤有问题的数据;加载则是将转换后的数据抛转到数据仓库。

数据仓库/数据超市

    数据仓库从定义来说,是具有主题导向、数据整合与时间性的数据库,它和一般在线交易系统(OLTP)不同之处在于,它储存的不是目前营运交易的数据,而是经过整理、汇总后的资料,让不同来源的数据拥有一致性的格式、名称,以免造成混乱。

    由于数据仓库以查询为主,修改机会不高,因此专门设计作数据仓库用途的数据库,会针对这个特性去设计加速查询的方法。

    数据仓库之外,也有数据超市这个概念相似,但规模较小,应用目的更为明确的数据汇整方式。数据超市虽然有成低本、建置快的优点,然而一旦企业需要跨不同的数据超市才能查询结果时,则会形成瓶颈。

 

在线实时分析(OLAP) 

    在线实时分析工具主要是提供使用者可以实时产生多维度的数据,以进行下钻(Drill down)、Slice、Dice、枢纽等种种不同分析。

 

    在线分析工具可以让使用者从不同维度来探索资料,这种分析方式让使用者可以不用依赖IT部门,自行建立问题分析报表,信息的取得更为实时,也更能有效支持决策。

    在线实时分析因为数据模型建立的方式不同,可以分为ROLAP、MOLAP。

ROLAP:针对建立在关系型数据库中的数据进行分析

    ROLAP指的是关系型在线分析系统,数据仍采用传统关系型数据库的储存方式,再透过中继数据的对应,产生分析所需要的结果。 ROLAP能储存的数据量大,但是效能逊于MOLAP系统。

MOLAP:针对建立在多维度数据库中的数据进行分析

    MOLAP指的是多维度在线分析系统,在储存数据时,便是以Cube(立方体)的概念储存,因此在进行多维度分析时便相当容易、快速。 MOLAP虽然速度快,但是受限于数据结构,可以储存的数据量受到限制。另外一旦需要的数据不在原有的维度中,就无法进一步查询。

HOLAP:对储存在两种数据库中的数据进行分析

    面对ROLAP和MOLAP各有优、缺点的情况,因而有HOLAP这种混合两者的新在线分析系统出现。检视合计数据时可以透过MOLAP数据库,而需要明细数据时则使用ROLAP数据库,透过这种方式解决鱼与熊掌不可兼得的困境。

动态分析报表

    在OLAP之上,有支持实时性分析的动态报表,和过去静态报表不同之处,就在于它能实时呈现分析结构,无需再重新执行报表产生的过程。动态报表除了支持上述的一些分析方式之外,也有越来越多厂商支持灯号、仪表盘、计分卡、地图等种种图形化的接口,让分析结果能更直觉呈现。
 

0
相关文章