数据是企业的无形资产,而好的数据库系统能够使这一无形资产大大增值。
“CIO对数据库系统不一定非常精通,但是一定要熟悉。”“长江学者”、清华大学经济管理学院常务副院长、博士生导师陈国青认为,作为企业高级管理者的CIO只有熟悉数据库的一些特点后,才能在做数据库系统选型和管理时游刃有余。
陈国青与数据库的结缘始于1978年。作为恢复高考后的第一届考生,他考入中国人民大学信息系,学习对当时绝大部分中国人来说都很陌生的数据库系统。1985年,陈国青被教育部选派赴欧洲留学,在比利时鲁汶大学攻读硕士、博士学位,专业也是数据库、数据挖掘以及数据分析。1995年,陈国青到清华大学经济管理学院任教,数据库管理成为其主要讲授和研究的课题之一。
“CIO是企业中能够把经营目标、经营单位转换为信息的人,是协调业务和技术的桥梁。而数据库是企业整个应用系统架构中的基础环节,所以CIO要熟悉数据库的类型和运作规律。”陈国青说。
其实,经过多年的信息化建设,国内诸多的企业积累了相当数量的数据,而这些数据,也被逐渐认为是企业关键的财富之一。不过,虽然大家都认识到数据财富的重要性,但如何进行数据的处理和深加工,向这些数据要效益、要营销、要管理,却成为诸多CIO难以解决的课题。
近日,CIO INSIGHT杂志社记者采访了陈国青,与他就当前数据库在企业业务中的作用,以及CIO如何更好地利用数据库进行了交流。
CIOI:请简要介绍一下当前数据库技术的特点?数据库系统在企业的信息化建设中处于一个什么样的地位?
陈国青:数据库在企业的信息化建设中是一个很基础的部分。在企业无论是进行信息管理,或者是进行信息系统建设,数据库并不是其中最核心的部分,它要和其他应用系统结合起来才能发挥最大的效用。信息应用系统主要描述了企业物料采购、产品制造、产品销售、开展售后服务等这样一个动态的过程,而其中,数据库是这个应用系统中不可或缺的一个环节,它是一个必要条件,也就是说企业的应用系统中没有数据库是不行的。但是光有数据库也是不够的,数据库上面还有大量应用型的信息处理技术和方法,比如ERP系统、CRM系统等。这些系统都是建构在数据库系统之上的,它们离不开数据库,因为很多结果包括中间结果或者最终结果都要借助数据库系统才能得到。
从某种意义上来说,数据库有点像我们给自己拍的照片,是某一阶段我们形象的反映,它的主要功能在于能反映现在企业的业务发展处在一个什么样的状态。从这个角度来讲,数据库是企业信息化架构中很重要的一部分,因为企业的高层管理者想要了解企业现在处于一个什么状况的时候,必须要通过查询数据库才能获得相关信息。
但从另外一个方面来讲,数据库并不能反映企业目前状态的全部。这个意思是指数据库反映的只是企业静态的东西,即使这个静态的时点很密集,但它也只是在某一个时点上的一个状态。而企业里面动态的特征,数据库一般是反映不出来的。所谓动态的特征,主要是指流程的东西、企业内部的信息流是怎么流动的、物理流是怎么流动的、企业都有什么事件出现等。
移动计算、网上银行等的发展,是否对数据库的功能提出了更高的要求?
在目前的数据库市场上,占据主流位置的数据库产品仍然是关系数据库。不过现在的关系数据库也开始变得日益复杂,它又融入了很多其他的元素,比如声音、图像、语音信息等一些面向对象的东西。因为关系数据库本身是有很多限制的,它是二维的、规范的,跟新出现的数据形式有很大的不同。现在国际上一般将这些新出现的数据形式称为极端数据,所谓极端数据是指数据形式变得日益多样,比如多媒体数据、异地数据、异构数据等,这与以关系数据库为代表的结构化数据是不同的。
数据库的这些新形式或者叫综合的形式,导致我们在数据库的支持上必须要有新的办法。比如我们的手机,过去手机只具有打电话的功能,而现在通过手机,我们可以玩游戏、看电视、看电影,还可以进行移动计算。移动计算的出现意味着企业的业务都可以变成移动的,企业的员工和客户在世界范围内不断流动的时候,也能够借助移动计算工具进行办公,从而导致了企业的时空概念在不断地发生变化。为了方便员工随时随地用手机等现代通讯工具登录公司内部网络,企业必须要改变传统的数据存储形式,提高数据存储的效率,这是企业当前面临的一个全新挑战。
极端数据的出现也就意味着一家企业最基本的后台可能是关系数据库系统,它的数据库必须能够接受这种多维的、实时的、非常极端的数据形式。在这种状况下,企业还必须采取相应手段来解决数据的有效存取问题。不过要实现极端数据的存储,不仅对企业的数据库系统而言是一个挑战,对企业的整体信息化架构和应用系统来说也是一个艰巨的挑战。
极端数据还使数据的检索变得日益复杂。关系数据库的存储往往是非常集中的,一般是在一家企业内部的机房,这样检索起来也就非常容易。但是极端数据却使得企业的数据可能来自全球各个国家,数据已经变成远程的、可移动的、数量巨大的,这就导致了现在企业对数据检索的效率提出了更高的要求。在这种状况下,传统的关系数据库里边的查询功能可能已经开始捉襟见肘了,而数据库的海量数据检索和海量数据挖掘功能也就显得日益重要。
那么随着企业中海量数据的不断增加,企业应该如何来平衡数据质和量的问题?
现代社会信息技术的发展使得我们所说的信息化出现了三个维度,它们解决的是不同的问题,而数据库系统也很好地体现了这三个维度。
“企业的信息化建设更多的是围绕着信息分析开展的,而信息分析的结果就是进一步支持业务的发展。如果信息分析比较到位的话,就能够获得很多对企业的决策和管理更相关或更有帮助的一些分析结果。”
第一个维度我们管它叫业务层,即通过信息化,企业主要想解决什么样的问题。企业在上数据库系统的时候,首先要明确希望借助它能解决的问题。一般而言,数据库可以做出反映企业目前状况的报表,从而方便了CEO和相关部门的主管根据这些数据做出对企业发展更有利的决策。
第二个维度主要是指对数据进行分析这样一个过程,它主要解决的是为什么的问题。如果企业相关人员在进行数据库查询或在报表系统里边突然发现了奇怪的数据,这时要想获知到底是哪个环节导致了这种状况的产生,就需要采用切分、多维、回溯等分析手段对奇怪的数据进行大量分析。这个分析功能当然离不开数据库,比如数据仓库的很多功能是和这个有关的。不过不管是数据库也好,或者是数据仓库也好,它们都只是一个存储媒介,或者叫做一个广义状态的反映,因此它必须还要有很多强大的分析和处理功能,就是它有很多算法或者说很多技术的处理内涵在里面。
第三个维度是指将来会怎么样,即企业如果做了某一个决策将来会发生什么。比如说一家在快速发展中的企业为了扩大市场份额想要并购另外一家企业,或者要去一个地方建一个新厂,或者要上一条新的生产线,这个过程必然会牵扯到大量的投资。这时,作为这家企业的CEO,就应该考虑一旦做了这个决策后,会发生什么问题,竞争对手和市场均会做出什么反应。这个过程就包含了很多个为什么,需要借助BI这样的数据挖掘工具进行分析。
你刚才提到数据仓库,那么数据仓库和数据库在存储、检索数据的时候有哪些不同?
数据库和数据仓库都能反映当前企业经营所处的状态,一般来讲,数据仓库是数据存储和处理的另外一种形式。
“对客户的行为进行准确分析后,企业才能明了下一步要生产什么样的产品、要对客户采取什么样的促销手段,这时就需要运用信息系统的分析功能和智能功能来做一些关联分析。”
与数据库是从二维视角反映企业当前状况的特点不同,数据仓库从很多维度上对数据做了划分,这种划分有点像超市里的很多货架,某一层全是食品,而还有一层可能全是电器。数据仓库也是做了很多这样的划分,而且划分得很细,从而使数据检索更为方便。
数据仓库主要是指围绕某些特定意义和目的的广义数据库,但它和数据库之间并没有必然的因果关系,并不是先有数据库,然后才有数据仓库。事实上,很多时候数据仓库在一定情况下才会发挥效用,比如当一家企业想采用精准营销时,需要借助切分、多维、回溯等功能对客户和市场进行细分,以准确界定客户群,这时建立数据仓库可能会带来很多便利。同时,CIO要意识到建立数据仓库的过程往往会比较费时,还要支出大量的成本,所以企业在建立数据仓库时要做好充分调研,认准企业的近期目标和远期目标、需要解决哪些关键点,比如关键行动因素或者关键业绩指标(KPI)等,只有这些关键点解决了,企业的目标才更容易实现。
在建立数据仓库时,要找到企业经营管理中的关键点。那么借助数据仓库这样的IT系统,能不能找到解决这些关键点的办法呢?基于数据仓库的智能分析决策,目前在实际使用中处于什么样的阶段?
智能分析决策属于前面所说的第二个维度,即“为什么”,是一种在线分析处理方式。从国外的发展态势来看,智能分析决策是属于商业智能前期的一个状态。当前,中国企业间的信息化程度差异很大,有的企业信息化程度比较高,有的企业则处于信息化的起步阶段,所以目前智能分析决策在不同企业的应用态势也不一样。这时,企业并不需要上完所有的信息系统后再做分析和决策,对智能分析决策应该采取灵活的态度,做分析和决策时完全可以是非常局部地来做。
对于企业而言,分析客户的购买行为是非常重要的,这是客户关系管理的一项重要内容。对客户的行为进行准确分析后,企业才能明了下一步要生产什么样的产品、要对客户采取什么样的促销手段,这时就需要运用信息系统的分析功能和智能功能来做一些关联分析。所以企业在做在线分析时,并不需要把所有的环节都信息化,最关键的是要看企业里面亟需解决的问题是什么,这时CIO的决策就变得非常重要,因为这个决策可能最终决定企业应该上什么系统。这个可以从“是什么”、“为什么”、“将来怎么样”三个维度进行衡量,这三个不同的维度所需要的信息技术要实现的功能是不同的。
其实,借助数据库存储数据只是一方面,更为重要的是要对这些数据进行挖掘和分析,这就涉及到了商业智能。因为从企业的角度来讲,过去很多纯业务的问题,比如做营销的或者是做客户的,看似和信息部门没什么关系。但是由于现在信息已经渗透到了业务的各个方面,因此很多业务决策变成了跟信息有关的决策。在这种环境下,企业的信息化建设更多的是围绕着信息分析开展的,而信息分析的结果就是进一步支持业务的发展。如果信息分析比较到位的话,就能够获得很多对企业的决策和管理更相关或更有帮助的一些分析结果。
那么在这个过程中,CIO主要发挥一个什么样的作用?毕竟很多数据分析都是需要精通业务和企业管理的人才能做的。
作为企业的高级管理者,CIO关注的并不单单是技术问题。一般地,他们在处理日常工作的时候,更要详细了解企业当前业务发展所处的状态,所以学习并掌握必要的管理知识和技能也就变得更为重要。
CIO在日常的工作中,要干的事情有很多。第一,CIO要做企业的信息规划和战略制定,而且信息战略的制定要和企业的经营战略融合起来;第二,CIO在企业里面还要通过培训等方式构造一种信息氛围,让企业员工能时刻感受到身处在信息化文化中;第三,CIO还要协调各职能部门的关系,这是其职能里面特别重要的一点。企业的信息化本身都是和业务相关的,经过多年调查,我们发现一般失败的IT项目都是和业务脱离的,而只有从业务部门的需求出发的IT系统才能在更大的概率上获得成功,因此CIO要不断地去和业务部门的相关负责人沟通。
此外,全球经济一体化的发展使得很多企业开始进行国际化的运作,这样外包决策和外包管理也成为CIO越来越重要的一项职能。在做IT外包时,伙伴管理和变化管理是CIO要重点考虑的两个管理维度:伙伴管理主要是指CIO要不断地和外包协作方进行沟通;变化管理是指CIO要时时关注企业正在进行的变革,并根据这些新的变革采取新的外包方式。
企业在建设信息系统时,CIO首先要了解现在企业需要解决的客户问题,以及要解决这些客户问题到底需要什么样的信息技术做支撑。在此基础上,CIO还要比较好地了解信息技术的支撑和管理问题之间的匹配,即什么样的管理问题需要什么样的信息技术,这是一个非常重要的问题。
“企业在建立数据仓库时要做好充分调研,认准企业的近期目标和远期目标、需要解决哪些关键点,比如关键行动因素或者关键业绩指标(KPI)等,只有这些关键点解决了,企业的目标才更容易实现。”
数据库建设也是跟企业的业务需求紧密相关的。当企业想构建一个更先进的数据库系统时,数据库就变成了一个新的信息化项目,这样CIO在做选型和实施的时候必然会涉及到管理方面的问题。
此外,数据库里有很多种产品,对CIO而言,要想准确地判断自己的企业需要哪种类型的数据库产品,从而给管理提供一个比较好的匹配,就需要不断增强自身的技术和管理水平。
CIO在做数据库选型时,如何选择更适合企业业务需求的数据库?
首先,CIO应该明确数据库目前的技术动态,当前数据库的类型有很多,其作用也各不相同。有些数据库可以支撑极端数据,不过不同数据库的支撑程度也存在极大差异,有的支撑力度要强,有的则非常弱;有些数据库是可以支撑远程计算,即分步式计算的。CIO不一定要特别清楚数据库的每个技术细节,不过对其基本功能、应用环境等应该有一个大概的了解。针对不同数据库的程序及其支撑功能,CIO都要做一个详细的了解。一旦CIO对这些了如指掌,那么就不会出现最终上的数据库系统并不适合企业业务发展需要的情况。
其次,CIO对企业目前所处的业务动态要做到心中有数。数据库系统有很多,CIO在做选型时,主要还是从自身企业业务发展的角度来看企业的信息需求是什么样的、需要什么样的数据库来做支撑。如果企业的数据库系统只是做工资报表的时候使用,那么普通的数据库就可以满足这个需求。而如果企业需要对数据进行强有力的分析,以便做比较大规模或者是非规范的数据存储,就要看哪些数据库能满足这样的需求。总之,选择适合企业当前业务发展的数据库,才是CIO在进行数据库选型时考虑的重中之重。
CIO在进行数据库选型时还要从企业竞争战略的角度进行考虑,就是企业数据库的选择和数据库的功能确定,需要和信息化的问题相关。即CIO要先清楚企业当前要解决的是“是什么”的问题、“为什么”的问题,还是“将来是什么样”的问题
转自《CIO Insight》