信息化 频道

数据挖掘的“无底洞”

    由于缺失商业分析和监督程序,数据挖掘工具在美国反恐中的应用陷于困顿。

    2001 年9 月27 日晚,纽约城市大学计算机科学教授Howard Rubin 正在家进行赎罪日祷告,这一天是希伯来历中最神圣的节日。此时,他家中的电话铃声响起,电话那头是前美国政府信息机构的一位最重要的官员。他问Rubin是否了解政府可以用来抓捕恐怖分子的IT技术。在克林顿执政期间,Rubin 曾就一些技术课题向美国政府当局提供过建议。但由于缺乏商业分析和足够的监督,Rubin 的答案——数据挖掘如今成为旋绕在这个智囊团大部分成员头上的技术咒语。

    就监督程序来说,美国政府为防止恐怖主义而开展的数据挖掘工作是一场灾难

  “无底洞”

    在IT 领域,数据挖掘是一个相对较新的应用领域,它把统计模型、高性能处理器和人工智能结合在一起,以发现并恢复有价值的信息,否则这些信息可能会一直被埋藏在海量数据中。零售商可以利用数据挖掘技术预测消费者的购物模式,信用卡公司可以用它查明信用卡欺诈。911 恐怖袭击之后,美国政府开始利用数据挖掘技术,帮助安全部门预防未来的恐怖袭击。

    现在,美国政府已经非常依赖数据挖掘技术,特别是在情报界。《2004 美国联邦政府会计总署报告》显示,美国政府部门积极参与或正在筹划的数据挖掘项目为199个,其中14个项目明确用于抓捕恐怖分子和预防恐怖袭击。这些项目还不包括美国中情局和国土安全部等7个部门的自有项目。在过去1年中,美国媒体披露,这几个部门都有一些高度机密的计划,涉及收集和搜寻电话记录、电子邮件和其他个人信息中的数据模型样本。当这项计划披露后,布什总统和其他政府高官都竭力为此辩解,理由是它对反恐很重要。

    有关专家指出,由于政府对这些数据挖掘工具的大力投入,以及情报安全部门所面临的巨大压力,所以相关官员批准这些项目的速度之快,大大超乎人们的想像。“如果这些项目有价值,人们就不会站到反对数据挖掘的阵营一边,不接受政府的这种做法。”RobertPopp说,他是美国国防先进技术研究计划下属的信息识别办公室主任。当然,政府官员对实施数据挖掘项目都有着直白的理由——“我们想保卫我们的国家和我们的生活方式。”Robert Gourley说,他是美国国防情报局(Defense IntelligenceAgency)的首席技术官。

    然而一些专家开始对此进行置疑——这些没有样本对象范围限制、没有预算限制和时间表限制的IT战略能否非常好的地实现预期目标。这是美国情报机构CIO们每天都要面对的难题。无论这些项目的意义如何重大,不加以控制,往往都会流于失败。据Sandish Group(一家跟踪IT成功率的分析公司)的观点,缺乏监督是IT 项目失败的主要原因。“政府没有人从IT价值角度看待数据挖掘工具,我也描述不出数据挖掘的价值,但我不会停止对它的使用。”Steve Cooper说,他是美国国土安全部(United States Department of Homeland Security, DHS)的CIO。

    根据他的说法,没有人会为政府的IT 项目做商业分析,以确定政府真的从IT 投资中获得了回报。政府为自己提供的有关项目是否合乎经济原则的解释似乎很充分——如果某个项目有可能抓住哪怕一名恐怖分子,那么它就是值得的。不过,假设美国政府管理IT 项目的历史记录特别糟糕,那么强制要求其对项目进行优先级划分和管理控制,结果反而适得其反。专家担心某些IT 项目会拖延几年,而有些好项目会因为涉及隐私和公民自由等被束之高阁。实际上,美国国会已经中止了大量数据挖掘项目,包括国防部的“全面信息识别计划”(Total Information Awareness project)。这项计划于2003 年野心勃勃地启动,它试图建立一个巨型数据库,收集、分析可能的恐怖分子的任何数据。

    因此,数据挖掘专家指出,企业的CIO 运用IT 战略,可以保证项目不脱离自己的控制,政府也需要对反恐的IT 战略进行类似的商业分析。“这些项目有着极为合理的目标,但没有监控程序。”Fred Cate 说,他是印第安纳大学应用虚拟安全研究中心主任。

0
相关文章