
陈小筑司长:大家下午好,咱们现在继续研讨会,这次研讨会得到各方面的关注,大家积极性比较高,所以我们安排的报告比较多,非常抱歉今天不留休息的时间了。今天下午第一个演讲的是林宁博士,第二个是房庆祝,第三个是按照原来的日程进行。下面有请林宁博士为大家做报告。大家欢迎。
【IT168 报道】各位领导,各位专家大家下午好,我汇报的题目叫异构应用系统间数据标准化,这个题目很专的,在我们组刚刚成立的时候,就提出过关于信息共享方面,数据怎么做,我记得当时讨论的时候,大家说这是一个难点,是一个很难做的事情,也就是说我们要不要做这个事情也讨论了很长时间,现在我们也确实在做这件事情,而且这个事情,这个标准化的工作,也确实特别难做。
我下面从四个方面向大家汇报一下,首先是问题的提出,解决方案和数据标准化的内容,以及数标准化的使用和管理。 问题的提出,等于说在我们政务信息资源交换数据的问题,它是一个发展中的问题,可以说在我们的政府部门,要履行它的职责,会对它的数据进行采集,这种采集都是各自为战的,这样的话就造成了我们很多的采集的数据的命名,它的类型,格式上的差异,也为我们以后信息的共享造成了一定的难度,另一方面在我们政务整个的发展过程中,各个部门它们对政务的需求,建立了很多内部的业务系统,这也是推动电子政务发展的一个非常重要的阶段和 的步骤,这也是发展的一个方面。
那么它建立的话,根据它设计的时间,理念,包括结构,还有我们选用的软硬件平台,都有很大的关系,尤其是异构系统之间的数据的交换,应该说更加肯定。
举一个例子来说,我们的这个语义的不同,造成了很多交换的问题,虽然同样是房地产的信息,它有叫证书编码,还有叫编码,那么这样比较多的,在对同样的事物里面,有不同的叫法,对同样的实体有不同的描述方向,不同的描述方法有不同的含义,那么到底怎么解决。
那么针对这种发展,包括税控,进出口,应急指挥等等都需要共享信息,那么这些信息怎么样共享,怎么样快速的反映,这也就是说随着部门间的信息需求的增加,对很多的数据都有要求。我们怎么样来解决这个问题呢。也就是说我们现在存在的问题的话,就是说应该是效率很低的信息交换,它损失的是什么,损失的是我们的这种资源,浪费的是我们的资源,那么换来的是这种共享,那么现在的一种解决方案呢,还是针对一些共购的,或者是相同数据类型的数据进行交换,用一种兼容数据的方式进行交换,那么从长远看,就是要建立一个信息交换环境,这样一个信息交换环境,来解决异构系统,和不同资源的交换,那么要建立这样的环境核心是什么,它的核心基础还是标准。
也就是说我们提出了一个,电子政务的政务信息资源交换体系,那么是针对异构应用系统间长期的解决方案,我们的指标,首先是要保证部门系统的持续的应急条件下,形成统一的信息交换环境,实现部门间的,数据间的有效交换,另一方面我们要在共享数据范围内,要形成统一的数据语义,第二个目标就是数据标准化所要达到的目标,所要做的事情,所以我下面讲的更多的是放在数据标准化,而且是放在异构的应用系统方面的数据标准化。 我们要知道整个资源系统,我们的数据需求到底是什么,所以也开展了这方面的调研,从一市一区,到四省八市两轮的调研工作,一个是政务部门间的信息共同基本目录,政务间信息共享指标目录,这应该是我们标准化工作的一个最基本的条件。那么其他的标准前面专家已经介绍了,我主要放在交换体系标准方面的介绍,其他的标准的话有其他的专家介绍,我更多的考虑的是调查的内容,等于说是交换体系内容的标准化,那么这方面,我们要考虑政务信息系统资源交换体系中,交换信息内容的标准化怎么做。因为我们在国际上我们也知道,有相应的一些标准,国内也有相应的标准,比如说美国的DOD的是83210,这是数据管理的规范,还用SO的11179,相应我们也制定了电子政务数据源的标准,这更多的是描述数据化的方法。 我们重点还是放在共性指标目录。根据调查初步的基础结果,我们开展了交换体系第三步骤,异构数据库接口规范,表示规范的内容,这样交换指标是一类,电子政务数据元素,是采用了电子政务国家标准源的部分描述,等于说在描述过程中,一个具体的信息实体的内容,那么信息实体对应政务的业务,另一方面呢,交换指标描述的是信息实体在交换过程中的基本特征,这是一个基本的,不是一个完整的,也就是说我们标准化要从一个最基本的集合开始,来逐步的形成一个更大的一个集合。
关于交换指标的表示形势呢,一共有6个属性,我们在这里主要考虑的是表示符,形成,说明,表示形势来表示交换指标。共享的信息实体,交换指标组合,就形成了具体含义的交换指标,下面这个图我们可以看,左边是共享信息实体,根据交换指标结合,具有了具体的含义,比如说婚姻登记证的编号,这样一个含义。 那么我们整个标准,就是这一部分的话,一共包括了共享信息实体是212项,指标项是2093个,整个分了三大类,第一个是自然人的相关的指标项,第二是法人的相关的指标项,第三是其他的相关的指标项,每一项都分了基本指标项和共享实体,信息实体两个部分,基本指标项主要是共享信息实体的标准信息,这样的话就是说我们在最基本的标准化考虑的话,应该从这几个方面考虑,基本指标项,那么自然人的基本指标项,一共有6项,从公民身份证号码,姓名,民族等等一共9个基本指标项,来描述自然人基本指标,形成了自然人基本指标项。这个图是一个自然人的基本指标项,比如说居民的身份证号码来源是公安,我们所有的这些,就是法人的话,一共是10项,它又有相应的表示,这些表示的话,在我们整个的资源里面反映在数据库里面,用一种数据管理的工具,来调用这些指标项。
自然人共享信息实体一共是94个,那么一共有848个交换指标,比如说我们的护士职业认证的信息的话,一共有5个交换指标项。法人共享信息实体一共有133个实体,下面列的只是一部分,公有1498个交换指标项,这样组成了整个的信息的内容。 关于异构数据标准的使用和管理,对于已经形成的系统呢,我们在政务信息资源交换体系中,要进行语义的转换,对新建的我们要提倡用标准化的数据语义来做,尽量减少转换和资源的浪费,另一方面数据的内容,要随着政务信息的发展不断的更新和完善,要形成一个动态的更新机制。 这样一个考虑的话,我们要从信息交换的需求,要从共享调研,就是信息这种调研,要从应用来考虑,我们的这数据的整理,梳理分析和提炼,要经过标准化的处理过程,形成数据标准。然后用数据标准管理这些工具,形成一个循环体,这样的话,就是保证我们的整个标准化在不断的发展,不断的完善。归纳起来的话,我们整个数据标准化应该分四个阶段,或者四个活动。
首先是要确定数据的需求,这个工作的话,我们前一段时间大量的调研,包括我们很多应用系统,应该在确定数据需求方面做大量的工作,同时我们考虑有一个队伍,要有相应的工具来做这个工作,这样制定数据标准,我们现在已经进行到制定数据标准,那么这很重要一点的话,就是说这些标准适不适用,我们要验证,我们要试点,所以我们很多试点工作,一个是在制定标准,一个是在试用标准,在完善标准,到下一步的话是批准数据标准,再走的话是实施数据标准,根据整个的应用,根据整个推广的话,那么数据还要更新,那么反过头来我们还是要走到制定标准这儿,那么根据新的需求的产生和应用的深入,我们还要确定数据标准的需求,也就是说整个标准化的流程的话,应该在整个目录体系和交换体系,我在这儿说的话,应该说更多的是考虑标准化这个工作,是一个基础工作,因为我们现在来做这个标准化的工作的话,应该说是在信息共享工作中,是刚刚起步,这种标准资源的积累需要很长的时期,我们也希望得到各个地方和政府部门的大力支持,让我们把这个标准化的工作,做得更扎实一些,因为我们也看到了,在国际上尤其像美国做数据标准化,已经做了三十多年了,已经积累了大量的标准的资源,那么我们的工作希望得到大家的支持,也希望大家能去用这个标准,只有用了这个标准,只有在实际中考验了这些,我们这些国际,包括数据这个标准,那么才有它的价值,那么才有它的实用性,也希望得到各个方面的支持,谢谢大家。
陈小筑司长: 谢谢林宁所长,下面我们请中国标准化研究院房庆副院长给大家做电子政务信息资源标识符编码方案,大家欢迎。