信息化 频道

搜索你的企业

编者按:企业对内部数据搜索的需求,正在让众多的搜索引擎公司为之努力。

  像用古狗(Google)、百度等搜索工具那样方便地去搜索你企业的所有文件和数据,这种想法听起来有些不着边际,但一名居住在美国圣荷西州的公司员工就做到了这一点。

  不需要进入公司的网络入口,只需在搜索框中输入关键词“plasma TV”,然后轻轻一点,这名员工就能在公司局域网上的全部计算机及其他资源数据中搜索所有关于“plasma TV”的资料,返回的匹配结果不仅包括来自公司东京办事处的同事的关于“plasma TV”的技术论文,也包括公司在美国纽约对的经理的个人电脑桌面上的关于“plasma TV”的客户名单,甚至是2003年公司发布在网上的新闻发布稿。

  对于大公司来说,每天有无数的文件和数据要存储,这些文件和数据查找起来是件很困难的事情,尤其是业务和分公司遍布全球的跨国公司,很多资料都存储在各分公司内部系统中,而且文件和数据的格式也都不同,全球各公司间的文件共享十分必要,但是想准确及时地查找到这些数据,就不是那么容易了。

  有了“企业搜索技术”,那些整天都有大量数据和信息资料等待处理的公司就不再头疼了,他们的员工再也不用为了查找公司某些内部信息而花上大半天的时间。作为一种重要的商业科技,很多大型公司已经开始部署企业内部搜索技术。

  和互联网搜索相比,企业网络搜索的信息量尽管要少得多,但复杂程度却要高得多。与互联网不同的是,企业的信息可能存储在多个地方,而且以多种格式进行存储。另外,企业级客户还要求稳定的存储系统,同时需要遵守相关的监管条例。企业搜索与互联网搜索的另一个重大区别是,在企业网络中搜索需要从多个数据源收集信息,并发现数据之间的逻辑关系。

  企业搜索虽然在技术上有很大的难度,但是国际商业机器公司(IBM)、古狗公司(Google)、雅虎公司(Yahoo)等都已经利用各种最新技术来实现企业内部的搜索。

  IBM公司日前开发出了名为“Masala”的企业搜索技术,在这款技术大大改进了进入大型组织获取数据的方式。它可索引和定位不同数据来源中的文档,并可以做到随源文件的更新而同步更新。据IBM公司信息管理集团的总经理珍妮特·佩尔纳(Janet Perna)称,IBM公司一直在悄悄地开发数据存储软件,该软件将能够极大地提高企业查找“分散”在网络上的各种文档。

  关系数据库是企业数据资源的“中流砥柱”,主要用于存储各种记录和交易数据。但约85%的企业资料被存储在所谓的非结构化数据源中——例如字处理文档、XML文档、图像,这就给资料的查找带来了困难。佩尔纳表示,与数据库相关的搜索软件将使企业客户能够以XML格式存储文档,这将大大提高文档的查找速度。佩尔纳认为,同时管理结构化数据和电子邮件、文本文档等非结构化数据代表着内容管理产业的未来。

  和IBM公司不同的是,古狗公司的企业搜索依靠的则是100多项复合算法,其中包括许多用于企业网络结构优化的算法。这项搜索系统在公司局域网内部能够保持不间断搜索状态,持续寻找新文档并对已存在文档自动更新。只需一个搜索框就可搜索多达150万文档存储信息,每分钟可接受处理300次查询。

  另一家搜索巨头开发的企业搜索技术又是利用了另一种原理。雅虎公司和Verity公司(Verity,Inc.)合作开发的企业搜索技术主要依据关联、类别以及内容来源等多种方法对搜索结果进行检验,还可以按照企业分类学对基于Web的内容进行动态分类,同时帮助客户利用可选的插件扩展外部内容访问。

  企业搜索技术正在向更多更准确更安全的方向发展,也逐渐被国外的企业所接受。通常情况下,企业的员工通过口头传达的方式了解业务报告,或者他们会重新编写一份已经存储在企业服务器上的报告。对现有报告“仓库”进行搜索,将大大加快员工了解业务报告的过程,还可能减少冗余信息。

  川崎汽车公司负责信息管理的主管维克多表示,企业需要能够处理不同类型的信息,适应不同的运行环境的内部搜索技术,而且搜索范围一定宽广。据称,著名的汽车公司日本马自达汽车公司也已购买和部署了企业内部搜索系统。

  飞利浦公司在全球各地的分公司有几百个,业务遍布全球160多个国家,拥有16.6万名员工。公司每天有大量的信息要在内部处理,企业内部需要全球信息共享,为了能够方便快速地查找其他国家分公司的资料,飞利浦公司在全球部署了一个统一的搜索平台。

  陈峤是飞利浦公司中国消费电子高级对外事务经理,陈介绍,飞利浦公司日常办公中几乎所有的信息都是数字化,连报销单也都电子版本的,这就给企业内部搜索提供了方便,通过这个搜索平台,员工只要登录到公司全球的局域网,就可以查到公司任何地方被公开允许查看的资料,包括各类文本文件以及财务数据,当然,对于保密级的文件和数据是有访问权限设置的。

  不过,搜狐公司副总裁王建军表示,企业搜索技术目前在中国本土企业中的市场还不成熟。由于很多中国本土的企业信息化水平还不高,很多资料都无法做到数字化,还停留在手工和纸张的阶段,这就无法让所有资料都能存储到数据库中供查找。

  一位灵通网的项目管理人员就向记者抱怨,平时工作中有很多涉及到项目的资料要查,这些资料往往牵涉到很多部门,现在主要查资料的手段就是向各部门发 e-mail请求,再由其他部门员工查完资料再回复,程序复杂,耗时费力。更糟糕的是,由于沟通也会存在问题,所以经常最终拿到手的并不是自己想要的内容,这大大降低了工作效率。“无数的数据、无数的文件,这样传统的查询手段实在让人吃不消。”面对分散的数据,这位管理人员作此感叹。

  在中国,囿于信息化基础建设的水平以及对企业搜索重视不够,很多公司还没有把企业搜索作为重要而紧急的商业科技列入规划,但随着企业对数据依赖程度的提高,大规模部署企业搜索技术已经为期不远了。当然,对于企业内部搜索来说,还存在很多应用上的问题,其中安全性问题尤为突出。

(信息周刊)

0
相关文章