【IT168 信息化】现在,你知道你必须要想出更好的办法来管理贵公司数量众多的关键的“主”数据。别担心,有这种想法的不止你一个人。据埃森哲公司在2007年对全球162名CIO开展的调查显示,75%的人表示自己想在接下来的三年内制订全面的信息管理战略。报告称,这么做将“进一步证实需要全面管理本公司的数据,利用这些数据获得战略优势。”
要取得成功,你需要主数据管理(Master Data Management,MDM)战略来阐明实际上你准备如何取得成功。它必须阐明如何得到全公司的认可和支持、最终的系统和数据管理做法会是怎么样以及将来使用的技术。对你的软件开发团队而言,选择MDM厂商是关键的第一步。
因为你得到的只是要求的服务,所以起草一份准确、合理的需求建议书(Request For Proposal RFP)完全有助于整个MDM项目。MDM平台的提供商Siperian发现,它在过去的两年收到的RFP数量出现大幅增长。公司主管们注意到,许多建议书缺乏一致、全面的视角――要确保长远成功,这种视角是必不可少的。Siperian看到许多RFP写得比程序员的简历还要差劲,于是列出了公司的CIO们为主数据管理项目编制RFP时常犯的十大错误。
Siperian公司的产品营销主管Ravi Shankar忠告CIO们要避免RFP方面的这些重大错误。这样才能为全面、灵活的MDM解决方案奠定基础,这种方案既满足当前需求,又满足将来不可预知的数据集成需求。他强调,不然,CIO们“到头来会面对大片主数据管理孤岛。”这显然与MDM解决方案的初衷背道而驰。
第一个错误:没有确保多个公司数据实体由单一MDM平台来管理
这是一大错误。你选择及部署MDM平台时,要确保它能够运用同一软件平台,管理多个公司数据实体,如客户、产品和诸多组织。这样一来,系统维护得到了简化,也更具成本效益,从而可以降低总体拥有成本。
Siperian在制药业的一个大客户之前就认识到需要为其企业MDM系统添加更多的业务部门和功能。现在它之所以能这么做,就是因为一开始就把灵活性纳入到了战略中。另一种办法就是部署及管理不同的主数据解决方案,每种方案管理不同的公司数据实体。不过这种方法会导致需要另外的系统维护和集成工作,还增加了总体拥有成本。
第二个错误:忽视了项目或者企业层面的数据治理需求
要认识到这个重要的方面:你在进行MDM时,其实进行的是数据治理。每家公司的数据治理各不相同,因为它基于每家公司独特的业务流程、文化和IT环境。不过,大多数公司在选择MDM平台时没有过多地考虑本企业的数据治理要求。底层的MDM平台能够支持贵公司定义的数据治理策略和流程,这至关重要。相比之下,你的数据治理设计可能受到损害,被迫适应有些MDM软件平台的固定或者刚性数据模型和功能带来的局限性。
据Shankar声称,控制和审查功能也是数据治理的重要组成部分。为了合理支持这项功能,RFP应当需要MDM平台与公司的安全和报告工具进行集成,从而提供对数据的细粒度访问以及可靠的数据质量衡量尺度。
第三个错误:没有确保MDM平台与公司的标准工作流程工具协同工作
工作流程是MDM和数据治理的重要组成部分,因为它可用于批准主数据实体定义的创建,还可用于实时确定存在哪些相互冲突的数据实体。
工作流程还可用于自动告知数据管理员(负责相应数据的员工)出现的任何数据质量问题。提出问题、表明MDM平台将如何与你所选择的标准工作流程工具进行集成,这很重要。”他又说,几家MDM厂商捆绑了自己的工作流程工具,但可能无法提供与CIO使用的标准工作流程工具进行集成的功能。他说:“有望与任何工具流程工具协同工作的开放架构是关键所在。
第四个错误:没有确保MDM解决方案支持复杂的关系和层次
如果有单一实体的主数据中心(Master Data Hub),如面向销售和营销的客户中心,那么诸多层次和关系就比较简单。反过来,多个数据实体之间的层次会相当复杂。例子包括:东部地区只储备某些产品的零售场地、确定信用风险大小的复杂的另一方法律层次、或者账户持有者的配偶是高资产净值人士。对大多数MDM厂商而言,事后才想到支持关系。他们往往说,这是MDM系统,拿去后你只要加上层次即可。这是不对的。需要把层次当成主数据。
CIO们要确保自己的RFP要求MDM解决方案能够为复杂的B2B和B2C层次建立模型,还要这些主数据实体的定义要遵循同一MDM平台。
第五个错误:依靠固定的面向服务架构(SOA)服务
可靠的数据是支持SOA应用的一个前提――SOA应用是指通过协调企业的SOA服务、自动处理业务流程的应用。因为MDM是提供可靠数据的基础技术,所以MDM环境的任何变化最终都会导致相关的SOA服务出现变化,因而导致SOA应用出现变化。
因此,CIO们要确保:一旦数据模型添加新的属性、实体或者源应用而得到更新,MDM平台就能自动对SOA服务进行改变。这种平台需要真正能够可以配置。RFP的这个重要部分进而会保护更高级的SOA应用,不受底层MDM系统出现的任何变化带来的影响。相比之下,如果MDM解决方案依靠基于固定数据模型的固定SOA服务,就需要编写定制代码,以便适应数据模型出现的底层变化――我们都知道编写定制代码意味着需要费用。
第六个错误:在MDM平台外面清理数据
数据清理包括:名称纠正、地址标准化和数据转换。虽然许多RFP提到数清理和数据质量,但它们没有提到数据如何清理、在何处清理――在MDM系统外面还是在里面,这个区别很重要。
通常而言,为部门级客户数据集成(Customer Data Integration,CDI)或者产品信息管理(Product Information Management,PIM)解决方案提供参考数据的源应用其数量很少。在这种情况下,可以使用常用的数据质量工具,在源应用处对数据进行有效清理。不过,对企业范围部署的MDM而言,源应用的数量可能涉及多个部门,由数十个甚至数百个系统组成。这种情况下,在源系统处清理数据是行不通的。而是需要在MDM系统里面集中清理数据。
如果贵公司已经统一采用标准化的清理工具,那么确保MDM解决方案直接能与清理工具集成就很重要。另外,要是CIO不知道自己数据的完整“家系”,那么等到审查及法规遵从检验的时候,就会面临一大堆头痛问题。
第七个错误:以为单单“概率性”匹配就够了
别害怕,概率性匹配(Probabilistic Matching)并不如你想象的来得复杂。“匹配”只是意味着MDM系统对数据进行调和的技术。如果你看一下MDM中心,就会发现系统的关键正是匹配。事实上,CIO们并没有认识到这一点:他们采用的只是各自心目中的某一种匹配技术。
举例说,如今人们常常使用几种匹配技术,如确定性匹配、概率性匹配和经验性匹配。他说“没有哪一种技术抵消得了主数据可能出现的各种数据错误和差异。
为了获得最可靠、最全面的视图以了解主数据, MDM平台应当支持这些匹配技术的组合,各自能够负责某一类数据匹配――打个比方说,就是支持混合型技术。单单一种技术如概率性匹配可能找不到全部有效的潜在匹配对象;或者更糟糕的是,可能会生成错误匹配。
第八个错误:低估了创建黄金记录的重要性
所谓的黄金记录(Golden Record)是指单一版本的事实,这也是大家所追求的。除非你有黄金记录,否则就没有MDM。为了适合所有流程,MDM就需要单一版本的事实。所以MDM要取得成功,单单使用注册库方法(Registry Style)来关联相同的数据还不够,因为这解决不了数据之间的不一致性。相反,来自不同源应用的主数据应当加以调和,然后集中存放到主数据中心里面。考虑到公司内部的潜在源应用数量之多、主数据的量之大,MDM系统能够为任何主数据类型(如客户、产品或者资产)自动创建黄金记录就很重要。
他指出,另外,MDM系统应当提供成熟可靠的“取消合并”功能,以便回退(roll back)任何人为的错误或者异常――这在好几个数据管理员负责管理主数据的大公司里面是一种常见活动。
第九个错误:忽视支持法规遵从的历史和家系特性
如今,公司用户不但要求干净、可靠的数据,还要求确认数据确确实实是可靠的,这是比较新的趋势。考虑到事务在处理时,以及主数据与主数据中心里面的其他相似数据结合时,主数据因源系统实时出现的变动而不断变化,这是一项颇具挑战性的艰难工作。
记录主数据所有变化的历史和表明数据变化的家系需要作为元数据捕获下来,这为审查奠定了基础,也是数据治理和法规遵从报告工作的一个关键部分。举例说,即使CIO们认为自己不需要这些财务功能,营销部门也需要跟踪那些决定参加或者退出营销活动的客户,这可能具有重要意义。
第十个错误:单单为一种操作模式实施MDM――分析型MDM或者操作型MDM
MDM不能只着眼于一种用途,无论是操作型还是分析型报告或者营销活动管理。企业的MDM平台需要主数据与操作型应用和分析型应用实现同步,这样才能充分地支持多个部门之间的实时业务流程和法规遵从报告。要是主数据与操作型应用和分析型应用无法实现同步,CIO跨公司扩展MDM平台的能力就会受到限制,维护成本也会增加。谁都不希望这样。