实时有多实时?
问题是,实时数据访问究竟有多“实时”呢?有23家连锁店的美国梦幻渡假村集团(MGM Mirage)有一套客户回馈程序系统,使用的数据比实时晚12小时。他们编制这套程序的出发点在于:如果客户离开拉斯维加斯一周后,才通知他们下次消费可用的获赠点数,就没有什么意义了。
在一天内,客户可能会使用不同的信用卡和身份证,走入多家在拉斯维加斯赌场地带的Mirage饭店、酒吧、戏院和赌场。而使用来自国际商业机器公司(IBM)的数据集成软件、微软公司(Microsoft)的SQL Server数据库和Acxiom公司(Acxiom Corporation)的数据聚合服务,MGM Mirage集团得以在隔夜后就把不同的身份整合统一起来,到第二天自动更新客户账号上获赠的积分点数。
“你得在信息处理速度和愿意支付的投资之间进行权衡。”首席技术官(CTO)汤姆-派克(Tom Peck)分析说,“在我们的例子里,接近实时就已足够好了。”
2年前IBM以11亿美元购并Ascential软件公司(Ascential Software),MGM Mirage集团使用的数据集成技术正是来自Ascential软件公司。在过去2年里,IBM还购并了许多信息管理领域的其他公司,包括以16亿美元购并FileNet公司及其内容管理系统;元数据管理供应商Unicorn公司;自然语言搜索供应商iPhrase公司;客户数据集成供应商DWL公司和身份识别供应商SRD公司。
这些技术,尤其是IBM购并Ascential软件公司和Unicorn公司所获得的技术,将成为IBM最新产品——信息服务器(Information Server)的一部分,IBM信息服务器软件包涵盖了多种WebSphere应用服务器产品,用于处理各种数据集成任务,如数据源分析(WebSphere Information Analyzer),核对重复记录(WebSphere QualityStage)和从一个数据源到另一个数据源的数据提取、转换与加载(WebSphere DataStage)。信息服务器是IBM信息随需应变(Information On Demand)策略中的旗舰产品。随需应变部门总经理安布吉-戈雅(Ambuj Goyal)表示,“我们依托信息服务器开创了一个新领域,相信以后人人都会跟进的。”
戈雅的话说得很大,但他确实有说这话的底气。从1982年开始他就在IBM工作,并在DB2数据库的早期开发上贡献良多。戈雅带领研发队伍开发了 RS/6000 SP 超级计算机和深蓝(Deep Blue)世界象棋冠军计算机。在短暂担任Lotus部门的总经理后,他成为信息随需应变部门的带头人。
信息管理的一个限制因素,戈雅表示,就是目前还没有出现一种基础性的技术。和10年前零散而不成熟的网站技术一样,信息管理也经各种技术逐渐融合演化而成:数据提取工具、清理工具和概要工具。戈雅预测,就像构成WebSphere应用服务器的基础Java虚拟机现在已成为网站应用开发的标准一样,被称为元数据总线的信息服务器基础也必将成为信息管理的标准。
IBM继续丰富它在信息管理上的产品组合。3月,它发布了OmniFind Analytics Edition,用于合并及分析非结构化数据源。该软件作为IBM最近刚升级的DB2数据仓库的一个模块发布,而DB2数据仓库则经常与信息服务器打包在一起。IBM的信息管理技术可不便宜:对一个大公司来说,这些组合可能要花上好几十万美元甚或更多。