信息化 频道

一招“抛砖引玉” 渡BI至成功彼岸

数据模型——看起来很美

  数据模型是表示信息或信息集合的方法。在一般情况下,将数据保存在关系型数据库中,旨在减少数据冗余和遵守“关系”的原则。它将数据分别保存在多个表中。分开保存在多个表中的数据,在访问数据库时,利用SQL命令等指定表的处理方法(组合法等)加以使用。分割的表之间存在概念上的组合关系。

  通常,企业处理的数据遍布整个表,有复杂的组合关系。但是,如果仅考虑处理(报表制作等)的表,那么组合关系以及数据的处理方法有一定的模式。这被称作数据模型。

  做这些数据模型的原则:尽量建星型,雪花是可以选择的,坚决杜绝循环模型。

  要先弄清楚实施BI的理由(这就是你的业务需要),然后再构建及完善数据模型,并确保来自多个系统的数据具有一致性。

  BI厂商试图利用主数据管理(MDM)解决方案来解决数据质量和集成问题,但数据治理、清理及调和等方面的工作不单单是BI的范畴,还会影响企业的每个角落。公司必须全面完成数据工作,这是一个长期项目,最好的策略是减少数据源,只留下可满足明确的业务目标的数据源。

  这样可以消除相互冲突的数据源,从而易于管理数据清理和集成。力求数据尽量准确,让数据更贴近上下文和元数据。减少数据源仅仅是第一步,它的作用是避免繁琐的工作,最关键的还是数据质量要达到标准。

  有些数据总是很“脏”,可能因为它来自外部,或者因为它是很难抽取的数据。一个常见的例子就是顾客的出生日期,因为顾客觉得没有必要向别人透露年龄,就随手输入11/11/11,或者干脆什么信息都不输入,于是产生了错误数据。

  IT部门在部署BI时面临的主要难题是数据质量,其次是集成来自操作型系统的数据,以及将BI软件与现有的IT基础设施进行集成。

  所以,“数据模型”这个看起来很美的名字,正在或者已经迷惑着我们BI用户的眼睛,企业的领导如果真的花巨资整一个完全适合业务模型改变的“数据模型”,除非这个企业将是行业领导性企业,他整出来的“数据模型”可以进行全行业销售才行。可惜,中国还没有这样的企业,这样做要么被欺骗,要么就是别有用心。

  总结:在每一个企业,没有一个业务人员喜欢自己只是螺丝钉,工作一成不变,只是听命行事,不知道为何而忙。“抛砖引玉”做的事很简单,就是真正给员工思考的空间,引导出他们的智慧。员工奉献宝贵的时间给公司,如果不妥善运用他们的智慧,才是浪费。当企业业务人员知道自己可以定义业务模型,来思考和分析,这是多么大的智慧空间!

0
相关文章