【IT168 评论】 提到商业智能,大多数人首先想到的是啤酒和尿布的故事,脑海里接着闪现出来的可能还有各式各样的复杂报表、仪表盘。不错,这就是我们希望BI可以达到的目的——实现智能化的数据分析,以简单直观并且丰富多姿的形式展现出来。
所以,我们清理海量的业务数据,设计复杂的数据模型,构建庞大的立方体,运用各种分析模型后,惊人地发现啤酒和尿布之间存在紧密的销售关系!于是决策者们下达指令,大量采购,并将二者放在卖场相邻位置。有好事者想见识一下深受新晋爸爸喜爱的啤酒的口味,拿着BI给出的产品代号按图索骥,却发现找到的是可乐!追查源头,早在产品信息录入系统时就已经张冠李戴了。绕了一大圈,和尿布哥俩好的竟然是可乐!
匪夷所思吧?你的BI很聪明,可是没帮上忙!耗费大量精力分析的对象是不完整或者错误的数据,精美的仪表盘据此显示出与事实有偏差甚至是完全相反的结果,最终导致使用者做出错误的决策。原因非常清楚——都是源数据惹的祸!BI能怎么办?
数据质量是商业智能项目根本中的根本。可是,在保证客户资料的有效性方面,BI起不了多大作用。除开上述例子中人为原因造成的错误,目前国内用户业务系统也普遍存在数据不准确或者缺失的问题。调整一下思路吧,BI工具不能修改数据,但可以在促进“数据质量”的提高方面发光发热。
商业智能应用的逻辑体系是目标——途径——-执行——配套——控制,如果我们把BI定位降低,强化执行和检查及处置层面的功能,在系统应用的初期(也许是两三年),着力于充分暴露数据质量问题,并坚定地把纠正的工作交给业务系统,从V1升级到V4、V5……每次版本的变更,都补充以往的不足,带来数据质量的提升。那么,随时间积累,数据在越来越完善的同时,也必将越来越准确。
说简单些,啤酒和尿布的故事中,如果做关联性分析前,我们通过常规的同比预警分析,发现了可乐的销量变化异常,通过异常原因分析,纠正了源数据的错误,就能早点发现尿布和可乐的地下情了。
如果接受这个思路,我们就该考虑,哪些问题可以在ETL阶段做脱离源的质量补救,哪些必须作为错误暴露出来,还有哪些只能以各种形式作出数据展现,由用户去判断是否需要纠正?如果没有对业务的深入理解,这些问题是无从回答的!做商业智能必须了解业务逻辑,不仅因为业务逻辑是企业领导人思维的主要体现,以此出发BI的基础才会夯实;更重要的是,我们从企业的业务逻辑中可以获知BI的作用重点和作用方式。从而帮助用户避免数据的错误使用,并引导用户进行深入的分析工作。
也许,你的BI没有智能的建模工具,没有高深的模型算法,甚至展示效果也只是朴实无华的简单报表,但只要它能够将正确的信息提供给有需求的人,保证提供给用户的信息能够轻松地访问、理解和采用,即使大材小用,谁又能说它不是一个聪明的BI呢?