信息化 频道

把玩数据于指尖

 

    数据是企业的无形资产,而好的数据库系统能够使这一无形资产大大增值。

    “CIO对数据库系统不一定非常精通,但是一定要熟悉。”“长江学者”、清华大学经济管理学院常务副院长、博士生导师陈国青认为,作为企业高级管理者的CIO只有熟悉数据库的一些特点后,才能在做数据库系统选型和管理时游刃有余。

     陈国青与数据库的结缘始于1978年。作为恢复高考后的第一届考生,他考入中国人民大学信息系,学习对当时绝大部分中国人来说都很陌生的数据库系统。1985年,陈国青被教育部选派赴欧洲留学,在比利时鲁汶大学攻读硕士、博士学位,专业也是数据库、数据挖掘以及数据分析。1995年,陈国青到清华大学经济管理学院任教,数据库管理成为其主要讲授和研究的课题之一。

    “CIO是企业中能够把经营目标、经营单位转换为信息的人,是协调业务和技术的桥梁。而数据库是企业整个应用系统架构中的基础环节,所以CIO要熟悉数据库的类型和运作规律。”陈国青说。

    其实,经过多年的信息化建设,国内诸多的企业积累了相当数量的数据,而这些数据,也被逐渐认为是企业关键的财富之一。不过,虽然大家都认识到数据财富的重要性,但如何进行数据的处理和深加工,向这些数据要效益、要营销、要管理,却成为诸多CIO难以解决的课题。

    近日,CIO INSIGHT杂志社记者采访了陈国青,与他就当前数据库在企业业务中的作用,以及CIO如何更好地利用数据库进行了交流。

    CIOI:请简要介绍一下当前数据库技术的特点?数据库系统在企业的信息化建设中处于一个什么样的地位?

    陈国青:数据库在企业的信息化建设中是一个很基础的部分。在企业无论是进行信息管理,或者是进行信息系统建设,数据库并不是其中最核心的部分,它要和其他应用系统结合起来才能发挥最大的效用。信息应用系统主要描述了企业物料采购、产品制造、产品销售、开展售后服务等这样一个动态的过程,而其中,数据库是这个应用系统中不可或缺的一个环节,它是一个必要条件,也就是说企业的应用系统中没有数据库是不行的。但是光有数据库也是不够的,数据库上面还有大量应用型的信息处理技术和方法,比如ERP系统、CRM系统等。这些系统都是建构在数据库系统之上的,它们离不开数据库,因为很多结果包括中间结果或者最终结果都要借助数据库系统才能得到。

    从某种意义上来说,数据库有点像我们给自己拍的照片,是某一阶段我们形象的反映,它的主要功能在于能反映现在企业的业务发展处在一个什么样的状态。从这个角度来讲,数据库是企业信息化架构中很重要的一部分,因为企业的高层管理者想要了解企业现在处于一个什么状况的时候,必须要通过查询数据库才能获得相关信息。

    但从另外一个方面来讲,数据库并不能反映企业目前状态的全部。这个意思是指数据库反映的只是企业静态的东西,即使这个静态的时点很密集,但它也只是在某一个时点上的一个状态。而企业里面动态的特征,数据库一般是反映不出来的。所谓动态的特征,主要是指流程的东西、企业内部的信息流是怎么流动的、物理流是怎么流动的、企业都有什么事件出现等。

    移动计算、网上银行等的发展,是否对数据库的功能提出了更高的要求?

    在目前的数据库市场上,占据主流位置的数据库产品仍然是关系数据库。不过现在的关系数据库也开始变得日益复杂,它又融入了很多其他的元素,比如声音、图像、语音信息等一些面向对象的东西。因为关系数据库本身是有很多限制的,它是二维的、规范的,跟新出现的数据形式有很大的不同。现在国际上一般将这些新出现的数据形式称为极端数据,所谓极端数据是指数据形式变得日益多样,比如多媒体数据、异地数据、异构数据等,这与以关系数据库为代表的结构化数据是不同的。

    数据库的这些新形式或者叫综合的形式,导致我们在数据库的支持上必须要有新的办法。比如我们的手机,过去手机只具有打电话的功能,而现在通过手机,我们可以玩游戏、看电视、看电影,还可以进行移动计算。移动计算的出现意味着企业的业务都可以变成移动的,企业的员工和客户在世界范围内不断流动的时候,也能够借助移动计算工具进行办公,从而导致了企业的时空概念在不断地发生变化。为了方便员工随时随地用手机等现代通讯工具登录公司内部网络,企业必须要改变传统的数据存储形式,提高数据存储的效率,这是企业当前面临的一个全新挑战。

    极端数据的出现也就意味着一家企业最基本的后台可能是关系数据库系统,它的数据库必须能够接受这种多维的、实时的、非常极端的数据形式。在这种状况下,企业还必须采取相应手段来解决数据的有效存取问题。不过要实现极端数据的存储,不仅对企业的数据库系统而言是一个挑战,对企业的整体信息化架构和应用系统来说也是一个艰巨的挑战。

    极端数据还使数据的检索变得日益复杂。关系数据库的存储往往是非常集中的,一般是在一家企业内部的机房,这样检索起来也就非常容易。但是极端数据却使得企业的数据可能来自全球各个国家,数据已经变成远程的、可移动的、数量巨大的,这就导致了现在企业对数据检索的效率提出了更高的要求。在这种状况下,传统的关系数据库里边的查询功能可能已经开始捉襟见肘了,而数据库的海量数据检索和海量数据挖掘功能也就显得日益重要。

    那么随着企业中海量数据的不断增加,企业应该如何来平衡数据质和量的问题?

    现代社会信息技术的发展使得我们所说的信息化出现了三个维度,它们解决的是不同的问题,而数据库系统也很好地体现了这三个维度。

    “企业的信息化建设更多的是围绕着信息分析开展的,而信息分析的结果就是进一步支持业务的发展。如果信息分析比较到位的话,就能够获得很多对企业的决策和管理更相关或更有帮助的一些分析结果。”

    第一个维度我们管它叫业务层,即通过信息化,企业主要想解决什么样的问题。企业在上数据库系统的时候,首先要明确希望借助它能解决的问题。一般而言,数据库可以做出反映企业目前状况的报表,从而方便了CEO和相关部门的主管根据这些数据做出对企业发展更有利的决策。

    第二个维度主要是指对数据进行分析这样一个过程,它主要解决的是为什么的问题。如果企业相关人员在进行数据库查询或在报表系统里边突然发现了奇怪的数据,这时要想获知到底是哪个环节导致了这种状况的产生,就需要采用切分、多维、回溯等分析手段对奇怪的数据进行大量分析。这个分析功能当然离不开数据库,比如数据仓库的很多功能是和这个有关的。不过不管是数据库也好,或者是数据仓库也好,它们都只是一个存储媒介,或者叫做一个广义状态的反映,因此它必须还要有很多强大的分析和处理功能,就是它有很多算法或者说很多技术的处理内涵在里面。

    第三个维度是指将来会怎么样,即企业如果做了某一个决策将来会发生什么。比如说一家在快速发展中的企业为了扩大市场份额想要并购另外一家企业,或者要去一个地方建一个新厂,或者要上一条新的生产线,这个过程必然会牵扯到大量的投资。这时,作为这家企业的CEO,就应该考虑一旦做了这个决策后,会发生什么问题,竞争对手和市场均会做出什么反应。这个过程就包含了很多个为什么,需要借助BI这样的数据挖掘工具进行分析。

    你刚才提到数据仓库,那么数据仓库和数据库在存储、检索数据的时候有哪些不同?

    数据库和数据仓库都能反映当前企业经营所处的状态,一般来讲,数据仓库是数据存储和处理的另外一种形式。

0
相关文章