信息化 频道

面向CRM系统的数据仓库的设计与实现

【IT168 应用】  近几年来,随着竞争的日益激烈,企业正在由以产品和利润为中心转向以客户为中心,客户关系管理(custorner relationship management,CRM)系统将以客户为中心的先进管理思想和经营理念,固化在软件系统中,在企业的正常运作中发挥着越来越重要的作用。

  一个CRM系统(以下简称CRM)要达到预期的满意效果,与其底层数据仓库的成功实施有着极其密切的关系。从某种意义上说,数据仓库技术是CRM的基础,因为CRM的很多工作都是咀数据仓库技术为基础展开的。数据仓库存储了企业内部和外部的各种数据,并将这些源数据整理成全面的、完善的客户信息库,通过联机分析处理(on-line analytical proccssing,OLAP)分析和数据挖掘来发现大量客户信息中所隐藏的价值规律,为企业提供经营决策方案。

  因而,CRM可以充分利用数据仓库的存储能力、分析能力以及帮助决策能力来制定市场策略、产生市场机会,并通过销售和服务等部门与客户进行交流,从而达到提高企业利润的目的。

  1 CRM系统

  1.1 CRM简介

  一个完整的CRM主要可分成3个部分:操作型CRM、协作型CRM和分析型CRM。操作型CRM是CRM中最基本的功能系统,它提供整个CRM的流程管理功能,主要是提供以客户为中心的市场、销售,服务与支持等业务流程的自动化。协作型CRM是以客户服务中心为主要表现形式,以计算机电话集成技术为核心,使客户可以通过电话、传真、E-mail、Web站点等方式更快捷、更有效地与企业进行交互。

  分析型CRM是通过对操作型CRM、协作型CRM、其它企业应用系统和外部数据源中保存的与客户相关的数据的集成,建立以客户为中心的数据仓库,获得企业范围内客户数据的一致视图,并以集成后的客户数据为基础,通过查询与报表分析、OLAP分析和数据挖掘等手段获取关于客户的知识,为客户提供个性化的产品和服务,提高客户的满意度和忠诚度,实现客户终身价值的最大化。本文主要针对的是分析型CRM。

  1.2 在CRM中应用数据仓库的必然性

  数据仓库是CRM的中心环节甚至是CRM的灵魂所在,它存储了企业内部和外部的各种数据,并将这些源数据整理成一致的、随时间变化的以及最大限度优化分析的客户信息库,通过OLAF分析和数据挖掘来发现大量客户信息中所隐藏的规律,为企业进行经营决策提供支持。另一方面,它将CRM的业务平台与分析平台进行了有效地分离,使得业务型数据库可以专注于事务处理,既提高了事务处理的效率又优化了分析处理的能力。

  传统的企业事务处理系统部是各个部门根据自身事务处理的需要保留部分数据,而且各个模块之间的联系并不紧密,虽然客户的部分信息也能从这些系统中获取,但远远不能满足需要。例如,对于一个典型的以客户行为为目标的分析,通常需要更多的日常积累的、反映历史变化的数据才有可能进行有效地分析,然而在这一点上传统的教据库系统是很难做到的(不论是从数据的存储量还是从数据的整合来考虑)。因此,数据仓库的引入是必然的。

  1.3 分析型CRM的体系结构

  将数据仓库技术引入到对客户信息的管理与组织上来,即建立一个面向CRM应用系统的客户信息数掘仓库,它实现了来自企业内部及外部的多种分割应用的客户信息的集成和统一,这正是分析型CRM的基本任务。如图1所示为分析型CRM的体系结构。其中,客户信息数据仓库是分析型CRM的核心,它的任务主要是从OLTP系统中抽取数据、把抽取出的数据进行统一的格式转换,将数据加载到数据仓库环境中(以上3步称为ETL,即extract,transform,load,抽取,转换,装载),管理和维护数据仓库中的数据。最后,通过对这些数据的OLAP分析和数据挖掘,企业管理者可以得到许多有价值的信息,从而更好地为客户服务。

  建立数据仓库时,这里采用的是一种可扩展的数据仓库体系结构,即中间层包括两种类型的数据库:一种是基本的包含多个主题的数据仓库;另一种足从属的针对某一主题的数据集市。如图1所示,这里根据数据仓库中的4个主题分别设计了4千数据集市。采用可扩展的体系结构,可以缩短数据仓库的建设周期,降低费用支出,并且避免了直接建立数据集市而不建立数据仓库所存在的扩展性较差、多个教据集市间难以保持同步的铗点。

  2 客户信息数据仓库的设计

  设计客户信息数据仓库的第一步就是要确立主题。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的对象。设计数据仓库首先要从操作型环境中的数据入手,结合决策支持的实际需要,确定数据仓库的主题。根据所涉及的分析型CRM的功能,该客户信息数据仓库包含了客户发展、客户购买、产品和市场营销4个主题。其中,客户购买主题主要是从不同的角度对客户的购买行为进行分析,如客户的购买行为同客户的背景信息之间的关联,其中背景信息主要包括客户的教育程度、收入水平、年龄、性别、是否已婚等。在客户信息数据仓库模型中,分3步来进行设计,分剧是概念模型、逻辑模型和物理模型设计。本文针对某网上书店,以客户购买主题为例,给出该客户信息数据仓库模型的完整的设计方案。

  2.1 概念模型设计

  数据仓库设计中概念模型设计的目的是确定面向主题的信息包围。信息包图作为一种公共的、一致的和紧凑的概念模型设计工具,能够明确反映用户的需求以及实现该需求所需的各种要素及其之间的关系。信息包图由名称、维度、类别和度量组成,其中类别表述的是维的层次性。

  该网上书店的客户信息数据仓库中客户购买主题信息包图如图2所示。其中,对于图书有3种分类方法,前两种较常见,还有一种是按图书存在形式分类,可分为普通图书、Vbook和Ebook。普通图书即传统纸制图书,Ebook指以计算机和网络为载体的电子图书,Vbook是一种新的多媒体演示、培训、商业交流的载体,具备音频和视频的功能,如各领域专家的讲座,教学考试类培训课程等。随着计算机的普及和网络的发展,Ebook和Vbook越来越受到读者的青睐。

  2.2 逻辑模型设计

  数据仓库的逻辑模型一般有星型模型和雪花模型两种。星型模型是基于关系型数据库的、面向OLAP的一种多维数据模型的数据组织形式,它由事实表和多个维度表组成,通过使用一个包括主题的事实表和多个包含事实的非正规化描述的维度表来执行决策支持查询,从而获得比高度规范化设计结构更高的查询性能。

  雪花模型虽然较星型模型更符合规范化的设计结构,但它增加了查询的复杂度,降低了查询的性能,因此,这里采用星型模型。

  星型模型的建立要以概念模型中的信息包圈为基础,将信息包图转换为星型模型,具体方法为:将信息包图中的度量实体放入星型模型的中心位置上,信息包图中的维度实体放入度量实体的周边。该客户信息数据仓库中客户购买主题的逻辑模型。

  2.3 物理模型设计

  物理模型是指教据在数据仓库中的存放形式和组织形式。设计物理模型,要在星型模型或雪花模型的基础上,确定事实表和维表的结构;明确二者的数据字段、数据类型、关联字段、索引结构;确定数据仓库中多维数据集的存储结构,如物理存取方式、数据存储结构、数据存放位置以厦存储分配是否分区等。进行物理模型设计时,应重点考虑的因素有I/O存取时间、空间利用率和维护代价。

  目前大多数数据仓库都是建立在关系型数据库的基础上,基终数据的存储是由数据库系统进行管理的。在该数据仓库的设计中,选用MS SQL Server 2000及其组件分析服务器来作为数据库和数据仓库的管理系统。数据仓库在逻辑上是多维的,但在物理存储上其多维数据集的存储方式可以有关系型联机分析处理(relational online analytical processing,ROLAP),多维联机分析处理(multidimensional online analytical processing,MOLAP)和混台联机分析处理(hybrid online analyticalprocessing,HOLAP)3种方式。

  在该数据仓库中,多维数据集的存储选择HOLAP方式,即基本数据保留在原有的关系数据库中,而聚合体则存储在分析服务器上的多维结构中,这样不仅可以避免数据重复,还能够提高查询性能(因为聚合体存储在多维数据集中),仅在频繁访问详细数据时对性能影响较大。

  3 实 现

  针对该网上书店,此数据仓库的实施是以MS SQL Server 2000平台为基础。通过SQL Server中的DTS服务,并辅以VBScript来实现将源数据导入数据仓库的ETL过程;通过AnalysisServices来建立多维数据集,实现OLAP操作,支持多维查询袁达式(multidimensionalexpression,MDX)查询,并通过自动构造MDX语句,实现上卷、下钻、切片、切块、旋转等OLAP运算。

  该客户信息数据仓库共包含了客户发展、客户购买、产品和市场营销4个主题,对客户购买主题的OLAP分析示例。其中,用户可以从客户所在地区、年龄层、性别、婚姻状况,职业、年收入层、会员星级、图书一按内容分类、图书按出版社分类、图书一按存在形式分类及时间共11个维度,来分析客户购买数量、金额、成本、利润及平均单价这5个度量。

  此外,利用Analysis Services所提供的数据透视表服务,用户可以用VB或其它语言开发自己想要的前端数据展现程序,也可以直接利用现有工具,如MS Office套件中的Excel、Access,来实现对多维数据集的数据展现功能,从而可以方便地得到各种统计报表和分析图形。利用Excel展现了对2005年不同年龄层的客户对不同种类图书的购买情况的利润分析。

  4 结束语

  本文主要阐述了数据仓库技术在分析型CRM中的应用,并针对某网上书店,以客户信息数据仓库中的客户购买主题为例,阐述了客户信息数据仓库模型设计的具体过程,并以MS SQL Server 2000平台为基础,给出了具体的实现。

  由于目前对数据仓库数据的利用尚局限在联机分析上,因而进一步的研究工作是建立相应的数据挖掘体系,使其在CRM的客户细分、客户获得、客户保持和客户服务等方面发挥积极的作用。

0
相关文章