信息化 频道

从IT架构认识BI系统

【IT168 信息化】BI(Business Intelligence)一词是由Howard Dresner在1989提出的,用来描述一种透过特定的概念与方法,让企业制定决策时能立基于事实基础之上。 

 

    为了实现这个目标,软件商各自发展出BI的解决方案,实现的技术各有擅长,但简单而言,便是从搜集数据、整理数据、分析数据的过程,最终再呈现给分析人员。每经过一个步骤,资料数据就好像经过粹练一样,更具价值。

    从IT系统的角度而言,广义的BI包含了ETL工具、数据仓库(或数据超市)、在线实时分析引擎和动态报表工具。底下我们将从BI架构分析各组件的组成。

ETL工具

    ETL是将数据进行撷取、转换与加载的过程,数据撷取必须从不同的数据库、应用程序,甚至是非结构化的文件,取得数据来源;转换则包含了像是格式转换、数据加总、合并或是过滤有问题的数据;加载则是将转换后的数据抛转到数据仓库。

数据仓库/数据超市

    数据仓库从定义来说,是具有主题导向、数据整合与时间性的数据库,它和一般在线交易系统(OLTP)不同之处在于,它储存的不是目前营运交易的数据,而是经过整理、汇总后的资料,让不同来源的数据拥有一致性的格式、名称,以免造成混乱。

    由于数据仓库以查询为主,修改机会不高,因此专门设计作数据仓库用途的数据库,会针对这个特性去设计加速查询的方法。

    数据仓库之外,也有数据超市这个概念相似,但规模较小,应用目的更为明确的数据汇整方式。数据超市虽然有成低本、建置快的优点,然而一旦企业需要跨不同的数据超市才能查询结果时,则会形成瓶颈。

 

0
相关文章