信息化 频道

汽车维修行业面向分析的数据仓库建设

【IT168 信息化】    随着汽车工业的飞速发展和人民生活水平的逐步提高,汽车维修行业和汽车配件行业得以迅猛发展。以宁波为例:截至2004年底,全市现有各类汽车 (摩托车)维修业户3 747家,其中一类维修企业85家,二类维修企业424家,三类专项修理企业1 246家,摩托车维修业户1 001家,机动车配件经营户956家,车辆综合监测站9个,客运车辆安全门检站26个。

    全市汽车维修企业(户)从业人员共计14 922人,其中生产工人11 639人,占从业人员总数78%,生产工人持证率(上岗证)达到99.3%。生产工人持证等级:初级工5 684人,占生产工人总数48.8%;中级工5 249人,占生产工人总数45.1%;高级工628人,占生产工人总数5.4%;技术人员(包括管理和双证书人员)421人,占生产工人总数3.6%。

    2002年与1997年全市维修企业维修车辆同比增长情况如下:汽车大修增加46.4%,二级维护增加58.8%,摩托车维修增加77.6%,维修企业共维修车辆增加23.8%,维修营业额增加39.3%。

    在发展如此迅速的现状下,如何推动汽车维修企业开展良性竞争,引导行业的正确发展方向成为亟待研究和解决的问题,同时也是需要行业管理部门予以关注和指导的问题。汽车维修行业管理部门在规划和指导行业发展时,需要大量长期积累的关于维修企业及汽车工业发展的历史数据作为数据支持和依据。目前,我国汽车维修企业在日常管理及经营活动中已开始推广使用基于联机事务处理(OLTP)的汽车维修企业信息系统,积累了大量汽车维修企业的细节数据,但是 OLTP本身的特点决定了它所采集的数据缺少综合性,无法为管理者的决策提供综合有效的数据支持。如何将各企业积累的数据进行综合管理并用于维修行业管理和决策已成为当前需要解决的主要问题。

    综上所述,本研究考虑将数据仓库用于管理大量的汽车维修企业积累的数据,让这些数据为汽车维修行业的管理发挥作用。

    1 设计与建立汽车维修行业管理数据仓库

    1.1 总体框架构建

    汽车维修及配件行业管理数据仓库系统的结构可以划分为如图1所示的3个部分:数据采集、多维数据结构构建和管理以及OLAP应用系统的开发。

汽车维修行业面向分析的数据仓库建设
▲图1 汽车维修及配件行业管理数据仓库系统结构

    在数据采集阶段,根据数据仓库的业务需求分析和主题域分析,从宁波市公路管理处(管理当地汽车检测维修和配件销售企业的政府主管部门,以下简称公管处)下属各企业的上报数据中抽取数据,进行清理、转换后载人数据仓库中。

    在多维数据结构创建和管理阶段,根据公管处管理人员的分析建立数据模型,将数据仓库中的数据按照一定层次进行聚合和汇总,构成信息分析的多维视图,最后选择一定的存储模式,将这些多维视图存储在OLAP服务器上。

    构建数据仓库的目的是满足管理人员决策分析的需求,因此用户界面友好、软件易用也是十分重要的,另外还要考虑用户所支付的开发和使用成本,所以在OLAP应用系统中考虑使用目前成熟的BI产品作为数据仓库的前端工具,以减少开发成本。

    1.2 汽车维修及配件行业管理数据仓库建模

    数据仓库建模是构建数据仓库的重要组成部分,是数据仓库构造开始的第一步。一般来说,在数据仓库开发过程中,数据模型具有3个不同的层次:概念模型、逻辑模型和物理模型。每一个层次实质上是前一种数据模型的精炼或更加详细的表达。在设计期间,通过多层次细化,建立与用户需求更加一致的面向主题的数据仓库。

    1.2.1 概念模型的建立

    笔者多次到公管处调研,通过了解他们的工作流程,确定以下几个内容是决策者希望执行的数据分析:全市各地区汽车维修企业的数量、情况及变化趋势;全市各地区汽车维修企业设备总价值和厂房面积变化趋势;全市各地区汽车维修量和维修营业额的变化趋势;维修人员技术水平(工种等级)、教育背景和培训时间的变化趋势;汽车维修合格率和返修率;客户投诉情况趋势等。

    汽车维修及配件行业管理数据仓库在建设过程中将综合考虑公管处的业务需求,同时仔细研究汽修行业目前积累的数据,通过业务驱动和数据驱动相结合来构建数据仓库。根据各方面分析结果,确定主题域描述如表1所示。

    表1主题域描述

汽车维修行业面向分析的数据仓库建设
 

    1.2.2 逻辑模型的建立

    1.2.2.1 分析主题域

    数据仓库的设计是一个逐步求精的过程,要对概念模型设计步骤中确定的基本主题域进行分析,上述概念模型中的企业基本情况主题联结各主题域。所以先考虑用这个主题来实施数据仓库的构建;维修主题中的维修是维修企业基本业务,又是进行决策分析的主要领域,第2步确定“维修”主题并实施数据仓库的构建;最后再完成职工和投诉主题。

    1.2.2.2 粒度层次划分

    由于在汽车维修行业信息管理系统中,对数据的查询和分析是多层次的,为了提高查询和分析质量,数据仓库按多重粒度来组织数据。

    分析数据时,在时间维上要对每月、每年企业的设备、人员和维修情况进行分析。所以在本项目中企业的基本情况数据和职员的情况数据是按照月份来组织的;维修事实表则是按照El、月、年3种粒度组织数据;由于投诉事件比较少,为了方便管理人员进行处理,投诉主题是按照投诉日期组织数据的。在本项目的数据仓库中采用多重粒度组织数据。

    1.2.2.3 关系模式定义

    数据仓库的每个主题可以由多个表来实现,笔者对选定的当前事实的主题进行模式划分,形成多个表,并确定各表的关系模式。

    以企业基本情况主题为例:在本主题中有企业资金产值表和企业设备场地表等多个事实表。由于篇幅所限,这里只截取企业资金产值信息事实表,如图2所示。

汽车维修行业面向分析的数据仓库建设
▲图2 企业资金产值信息事实表截图

    常见的基于关系表的存储方式有两种:星型模型和雪花型模型。星型聚合快,效率高;雪花型结构明确,便于与OLTP系统交互,占用空间小,但是模式较复杂,浏览困难,并且额外的连接将使查询性能下降。在本项目中,数据量较小,数据结构简单,所以本项目选用星型架构,本项目数据仓库中维度模式的星型架构模式图如图3所示。

汽车维修行业面向分析的数据仓库建设
▲图3 企业基本情况主题的企业资金维度星型架构模式图

    在数据仓库构建过程中采用维度建模,经过对主题的分析和数据的研究,数据仓库的每个主题可以由多个表来实现,对选定的当前事实的主题进行模式划分,形成多个表。本项目中关系模式均采用星型架构,数据仓库中目前共建立了5个事实表、9个维度表。

    1.2.3 物理模型的建立

    在考虑存储结构时应考虑3个方面的因素:存取时间、存取空间和维护代价。为了提高分析质量和响应速度,采用了一定的数据冗余,这些数据冗余对数据库查询速度的影响不大,可以忽略不计。

    在逻辑设计时使用Microsoft公司的SQL Server 2005。本项目中索引建立策略为:首先为各表(包括事实表和维表)的主键建立聚集索引;在事实表的外键上建立非聚集索引;然后根据实际的运行情况,通过 RDBMS(关系型数据库管理系统)提供的数据库监控工具,建立一些合适的非聚集索引,从而获得最高查询性能。数据存放位置涉及存储设备的存取速度。由于目前高速存储设备较为便宜,性价比较高,因此主要以硬盘为存储媒介。

    2 联机分析处理的设计与实现

    利用SQL Server 2005中Analysis Services功能建立OLAP多维数据库,利用上文中构建的数据仓库作为数据源。建立多维数据集时,根据需求分析和数据仓库的建模分析,选择合适的事实表、度量值和维表,利用SQL生成维度。本项目共生成5个多维数据集,并在此过程中生成9个共事维度,如图4所示。

汽车维修行业面向分析的数据仓库建设
▲图4 多维数据集

    本研究可以采用Microsoft的EXCEL软件或普科(ProClarity)公司的ProClarity6.0作为数据显示分析的前端工具。前者具有成本低廉的优点;后者功能强大且能和SQL Server 2005实现无缝联结,使用方便。使用ProClarity6.0风险报警功能分析OLAP立方数据,其界面如图5所示,图中数据为企业的利润率,粗体数字表示该企业的利润率低于警戒值,这时管理部门应该密切注意有报警标志的企业,尽量避免由于企业经营不善引发的恶性连锁事件。

汽车维修行业面向分析的数据仓库建设
▲图5 使用ProClarity6.0风险报蕾功能分析OLAP立方数据

    3 结束语

    在全面调研汽车维修行业管理现状的基础上,笔者研究了数据仓库系统的设计与实现方法,提出了将数据仓库应用于汽车维修及配件行业管理的设想,构建了汽车维修行业管理数据仓库体系结构,并研究其设计方法、构建技术及联机分析等技术。

    在此过程中,数据仓库的建模是整个开发过程中的关键技术,本研究采用维度建模,首先考虑如何满足和适应汽车维修行业管理的需求,通过业务驱动和数据驱动相结合的方法实现了该目标;其次是如何提高查询效率,本研究采用星型架构和适度数据冗余来提高查询效率;最后要考虑数据仓库的未来可扩展性,汽车维修行业管理的业务除了在文中列出的企业情况、维修、职工和投诉外,还有汽车检测和汽车配件出售业务,这些业务的数据可通过添加相关主题域并构建事实表和维度表,方便地加入到目前的数据仓库中。

0
相关文章