【IT168 专稿】如今,信息资源的异构性在企业信息系统中无处不在,越来越多的应用需要访问各种异构数据源。任何企业应用,首先需要解决的就是如何对企业中的异构数据源进行集成和一致化处理,形成标准、统一且可靠的数据源,来作为应用系统的基础。这也是解决大多数企业信息孤岛问题的关键。
为了达到异构数据源的共享,异构数据源集成与转换问题必须解决。本文重点介绍用Globus Toolkit 和OGSA-DAI建立异构数据集成平台,利用此平台对各个异构数据源进行无缝连接,对各个节点数据源提供数据共享注册的功能,集成中心协调管理各个节点数据源,为用户提供一个统一透明的访问接口。
网格服务实现异构平台间的互通
网格服务(Grid Service)技术是在开放网格体系结构OGSA中提出来的,它是对Web Service 的扩展,实际上就是一种Web Service和以往网格技术融合的产物。其最大优势就是提供了异构平台无缝衔接的技术手段,实现异构平台间的互通。网格工具软件包Globus Toolkit已经成为对OGSA进行规划和组建的开发平台,它将web服务、数据库存取、J2EE等技术有机的纳入网格中,从而形成构建网格系统的标准和规范。
在异构数据源集成中使用Grid Service的目的就是将服务功能以接口的方式提供给用户,数据库访问操作则通过中间件平台完成。用户不需要了解后台的实现过程仅需调用功能接口就可以完成对数据库的操作。Grid Service将客户对数据库的操作目的封装成SOAP对象,通过http传送到Web服务器,Web服务器将接受的SOAP对象转发给Grid Service请求服务器;Grid Service请求服务器解析收到的SOAP请求,调用Grid Service,对数据库进行操作,然后将返回结果生成相应的SOAP应答。Web服务器收到SOAP应答后,再通过HTTP应答的方式将结果返回到客户端。
过程如下图:

该平台框架设计如下:

基于Grid Service的数据集成框架
集成平台中的各个节点数据源以Grid Service的方式对外发布,WEB应用客户端或者其它应用程序客户端从不同的平台,不同的软件开发环境调用该中间件的Grid Service接口,从而获得来自不同节点数据源的数据,实现数据的透明访问。
用户通过客户端的资源浏览器能看到系统的统一数据视图、对数据进行访问和操作、调用系统提供的网格服务等。客户与网格服务器之间的通信是调用网格服务接口进行的,之间的传输协议是SOAP访问协议。它们的交互数据通过XML语言进行统一描述,便于系统的理解,这样,客户端就可用浏览器对返回的数据进行解释和显示。
网格服务接口负责通过标准的Grid Service接口形式向用户提供访问整个网格环境内已经发布的数据源的方法。每个业务节点都拥有一个Tomcat (Apache)服务器,以作为Grid Service的运行平台。每个节点有拥有一组Grid Service服务,但是网格环境的每一个节点必须至少拥有一个管理器的服务,从而能够与上层的网格服务(Grid Service)管理与发现层进行交互。
其中各个节点系统所提供的数据并不需要先复制到系统的中心数据库中,而是以Grid Service的形式发布出来,只有当用户发出服务请求的时候,数据才从节点系统经过数据集成平台直接传递到用户。这样,用户得到的永远是最新的信息。当节点系统中的数据格式变更或增加了新的数据时,只需要以新的Grid Service发布出来,用户通过数据集成平台使用服务并获得相应的数据。数据中心和客户端,都不需要任何改动,这就实现了系统之间的低耦合。