信息化 频道

WWW之父:用连结性数据将政府信息上网

【IT168 信息化】当Vivek Kundra就任美国联邦CIO后,他认为政府信息公开是首要任务,希望透过信息公开来达到奥巴马向全民负责的承诺。因此,最近半年来,许多美国政府官员纷纷询问因特网之父Tim Berners-Lee,要如何将政府数据放上网络。

 


WWW之父Tim Berners-Lee认为,政府信息可用连结性数据的形式,放上网络。

     Tim Berners-Lee认为,2009年是政府信息上网之年,不论是美国或英国政府都承诺要开放政府信息。而且,很多官方机构早已是每年定期将政府信息公布在网站上。 他认为政府信息上网有三大好处,首先是能提高人民对政府功能的认识,进一步促使人民拥有更大的权利和义务。第二是能贡献出对世界有价值的信息,最后是数据开放能让政府和世界的运作更有效率

连结性数据的三大特性

    为了达到这三个目的,Tim Berners-Lee建议推动电子化政府的官员,最好采用连结性数据(Linked Data)技术来处理上网的政府数据。

    连结性数据是一种数据格式的特性总称,凡是具备了开放、模块化和扩充性,这三种特性的数据,都可以属于连结性数据。第一个特性:开放(Open),是指各种应用程序可任意取用数据,不受限制,而且是采用开放数据格式,非专用格式。

    第二个特性是模块化(Modular),任何连结性数据的片段,都可以任意组合(如Mashed-Up)成新的连结性数据,例如用台北市民健康信息可以由台北市户政数据和健康局的数据组合而成,健康信息还能再组合。

    第三,扩充性(Scalable),连结性数据要让使用者很容易地对原有数据进行扩充,甚至是以前用过的名词和定义,即使现在已经随时间改变了,还是要能够让任何人很容易可以进行扩充或修改。这三点是Tim Berners-Lee认为连结性信息的必要特质,也是政府单位释出政府信息时,可以遵循的数据处理原则。

    不过,优先级上,Tim Berners-Lee认为:“第一优先是将原始数据上网,其次才是建立连结性数据。”

 

两种政府数据上网的方式 

    一般来说,有两种将政府数据放上网的方式,第一是由上而下的方式,先成立国家计划或委员会,找有兴趣的人来开会,定义出符合所有数据特性的共享词汇和分类架构(Ontology)。不过,Tim Berners-Lee指出,这种方式非常耗时,也往往很难有共识。 他推荐另一种由下而上的方法。取得高层授权后,就先把数据放上网络,由使用者集体参与的结果来决定出数据最后的形式,之后再整合。

    另外一个政府信息上网的秘诀是,须先盘点拥有的全部数据,然后判断出哪些数据放上网络,最能符合成本效益比。不过,这类评估工作同样费时,所以,Tim Berners-Lee建议:“先拿一些数据放上网吧。”

    Tim Berners-Lee也特别提醒,政府信息上网并非是要恐吓或干扰原本负责处理数据的机构或官员,所以,必须确保原来的系统或体制不受干扰,由原本处理数据的人员也可以参与。

    数据形式上,不论原始数据是放在关连式数据库、电子表格档案或XML档案中,都可以先转换成RDF格式。提供数据的网站需要建立索引,提供XML、CSV文件和网络应用常使用的JSON格式,每项数据注名数据来源,最好也纪录所适用的授权方式。

    此外,政府网站的角色,并非是和外部网站竞争。外部网站可以增加政府数据的价值,所以,网站主事单位可以建立回馈机制,搜集使用者意见来决定信息格式。

    W3C协会也成立了一个eGov特别工作小组(eGov Interest Group),来讨论政府信息上网的挑战和解决方法。Tim Berners-Lee建议官员可以到这个小组中寻求支持。

 

0
相关文章