编者按:不经意间,埃克希姆公司的数据管理业务已经做到了数十亿美元的规模。其中的经验值得学习。
埃克希姆公司(Acxiom Corp.)历来擅长数据管理,特别是对海量数据的管理。据公司自己统计,目前他们管理的客户数据及预测数据已经超过200亿条。
“我们有三种业务做得非常出色:一是管理海量数据,二是清洗数据,转换数据格式,并提高数据质量;三是依靠数据建立商业智能(BI),提高决策质量。”阿莱克斯·迪兹(Alex Dietz)说。迪兹是埃克希姆公司的“产品与基础设施技术负责人”,这个职位的功能相当于一般公司的CIO。在埃克希姆公司,职务的头衔都没有采用传统的命名方式。迪兹说,目前大约有1,000多家客户使用埃克希姆公司的数据。这些数据的用途非常广泛,既可以用来编制名录,通过电话销售发展信用卡用户,也可以用来对应聘员工进行筛选,或者对违法金融交易进行调查 。
埃克希姆公司坐落于美国阿肯色州(Arkansas)中部小石城(Little Rock)周边的群山中。小石城因为美国前总统克林顿(Clinton)、白水门事件(Whitewater)和罗丝律师事务所(Rose law firm)而非常著名。不过,埃克希姆公司却一直非常低调,尽管公司的业务举足轻重。在截至去年3月31日的2004财年,公司收入达到了10.1亿美元,从而挤进了10亿美元公司行列(the billion-dollar club)。有很多著名公司都是埃克希姆公司的优质客户,如美洲银行(Bank of America)、摩根大通(J.P. Morgan Chase)和美信银行 (MBNA America)等金融服务公司;西尔斯百货公司(Sears)和联合百货公司(Federated Department Stores)之类的零售商;以及菲力浦·莫里斯公司(Philip Morris)之类的小包装消费品制造商。
数据采集本身具有风险。2003年,埃克希姆公司从捷蓝航空公司(JetBlue Airways Corp.)的乘客名单中采集了部分数据,提供给了一家名不见经传的军方承包商,后者用这些数据来为美国军方开发反恐软件。埃克希姆公司的这种做法,激起了隐私权保护者的强烈抗议。2004年年初,埃克希姆公司再次成为各方关注的焦点。美国联邦检察官指控一家通过垃圾邮件进行销售的公司领导,入侵埃克希姆公司的内部系统,窃取了8.2GB的个人数据、金融数据和公司数据。这些数据价值超过700万美元。
很多公司都在设法解决由客户数据而引发的各种棘手问题,埃克希姆公司并不是唯一一家。这些问题包括:如何采用新的方法来管理日趋庞大的数据并从中获取价值;如何保护这些数据免受外部和内部的威胁;如何在一个越来越专注隐私权的社会环境下开展业务。因此,埃克希姆公司是如何迎接这些挑战的,对别的公司具有很好的借鉴意义。公司领导人(也可以说是 CEO)查尔斯·摩根(Charles Morgan)在介绍公司业务模式时表示:“我们真正关注的,是如何使用信息才能让消费者从中得益。我们必须向消费者表明,他们的信息在被我们以及我们的客户使用后,他们也能从中获得价值。”他进一步指出,“我们需要那些乐意提供数据的消费者,他们的数据将帮助我们的客户获得成功。”埃克希姆公司现在面临的挑战是:如何保证这两方能够和谐互动起来。
在埃克希姆公司11个戒备森严的数据中心里,究竟管理着多少数据,就连公司的员工也没人说得清。
公司的中央数据中心位于阿肯色州小石城北面的康威城(Conway)。这也是公司最初创业的地方。埃克希姆公司始创于1969年,当时是从当地一家公共汽车制造商分拆出来的一家公司。从芝加哥城外伊利诺伊州的道诺斯葛罗夫(Downer’s Grove)到英国的森德兰(Sunderland),埃克希姆公司都设有数据中心。公司最近在凤凰城(Phoenix)又新建立了一个数据中心,另一家正在建设中的数据中心位于小石城西面。最准确的估计是,仅在康威城的数据中心,埃克希姆公司就管理着1.5~2.0 PB (petabytes),也就是约2,000 TB (terabytes)的数据。
这些数据中的一部分构成了埃克希姆公司的信息产品,比如Infobase消费者数据库和分成70种不同类别的Personicx美国家庭用户名录。埃克希姆公司的客户利用那些产品建立市场营销名单;检验自己的消费者数据库中的姓名、电话号码等信息的准确度;添加抽样统计的详细信息;或者对人事数据进行核对。埃克希姆公司目前还在扩大产品线:2004年8月,公司推出了人生变化系统(Personics LifeChanges)。该系统对美国普通家庭诸如结婚买房等重要人生阶段进行跟踪。这类数据产品占公司的收入比目前刚刚超过五分之一。
为了建立自己的数据存储资料库,埃克希姆公司从公开和私人渠道广泛收集各种信息。公司掌握有全美930个县的财产转让登记信息以及3,500个电话簿的信息。它还从私人渠道购买信息,例如产品目录和杂志订户名单以及消费者调查报告的研究结果。
不过,埃克希姆公司所管理的大量数据,所有权并不属于它自己,而是属于别的公司。埃克希姆公司有超过一半的收入来自与数据相关的服务。比如,建立数据仓库和数据仓库托管服务,整合和清洗消费者数据,运行客户关系管理(CRM)系统,制订针对消费者的促销名单,分析或协助客户分析自己的数据。摩根说,客户通常会把所有的消费者历史数据在埃克希姆公司存放三年,但现在的趋势是存放五年。“我们希望这些客户把埃克希姆公司的数据中心看成是他们自己的数据中心的延伸。”他说。
位于美国罗得岛州首府普罗维登斯(Providence, R.I.)的美国国民银行(Citizens Bank),聘用了埃克希姆公司管理客户数据,并负责确认和更正姓名、地址、电话号码、生日等信息的日常处理流程,同时,清除因为客户使用国民银行多项服务而产生的重复信息。2004年年初,银行的客户数据库与埃克希姆公司的IT系统建立了连接。国民银行CIO比尔·雷(Bill Wray)在接受采访时说,“客户与银行的关系已经变得非常复杂,不再是简单的账户存取或查询了。”
埃克希姆公司并不满足于管理其他公司的数据,它还希望能够管理对方的数据中心。几个月前,埃克希姆公司与信息资源有限公司(Information Resources Inc., IRI)签订了一份重要的IT外包合同,合同价值预计达到数千万美元。IRI公司的主要业务是采集零售POS机上的数据以及其他消费支出数据,并出售这些数据。根据合同,埃克希姆公司将负责这家公司的数据中心的运营,并为其建立一个实时的内容传输系统。
埃克希姆公司是世界上最大的数据集成和数据库管理公司之一,掌握超过200亿条的顾客数据和预测数据;
埃克希姆公司把数据中心外包作为新的业务增长点,重点瞄准数据密集行业的客户。在这类公司中,公司能够提供优于传统外包竞争对手的增值服务。
在有关隐私和安全问题等方面,公司已经成为争议的焦点。争议的问题之一是是否应该向政府部门提供消费者数据,以及应该以怎样的方式提供。
埃克希姆公司并非初次试水外包市场。大约在16年前,诺曼·V·皮尔(Norman Vincent Perle)领导的路标组织(Guideposts organization)就成为了公司数据中心外包服务的第一位客户。埃克希姆公司收购了信息管理服务提供商May & Speh公司(May & Speh Inc.)后,于1998年正式成立了外包部门。目前,外包业务已占到公司销售收入的四分之一。
埃克希姆公司把外包作为了公司业务的一个新增长点,重点关注数据密集行业内的公司,比如小包装消费品行业、金融服务业、零售业等。公司运营负责人李·霍吉斯(Lee Hodges)认为在这些领域,埃克希姆公司的数据管理能力和技术水平,即便与国际商业机器公司(IBM)或电子数据系统公司(EDS)等IT服务巨头相比也毫不逊色。埃克希姆公司把与IRI公司的合同视为其外包战略中的一个里程碑。IRI公司从超市、药店、其他零售商和七万户志愿者家庭收集大量产品销售数据,并把这些数据出售给包装产品(packaged-goods)制造商。IRI公司与埃克希姆公司签订的合同长达15年,每年价值在2,500万到 3,500万美元。作为合同的一部分,埃克希姆公司正在为IRI公司开发一套随需应变的数据系统,能以接近实时的速度处理零售数据,将它们与抽样调查数据结合起来出售给IRI的客户,以便他们能尽快对消费者购买倾向做出分析研究。埃克希姆公司还与IRI公司一起开发应用软件,帮助零售商和制造商对新产品介绍信息进行管理、分析价格和促销的有效性,同时对出库商品进行跟踪。
埃克希姆公司与IRI公司合同中的一个关键部分是公司的网格计算技术(grid-computing technology)。该技术又被称为客户信息基础架构技术(Customer Information Infrastructure,CII),约占埃克希姆公司所有IT资源的10%。埃克希姆公司的网格技术之所以能够打动IRI公司,主要因为它的处理成本低于大型机(mainframe)或大型多处理器服务器(big multiprocessor server),同时还能使IRI公司把新的信息产品更快地推向市场。IRI公司首席技术官马歇尔·吉布斯(Marshall Gibbs)表示,尽管IRI公司在自己的数据中心已经有了两台惠普(Hewlett-Packard)的Superdome服务器,但公司还是缺乏将大量数据转换成有用的商业信息的处理能力和技术。“埃克希姆公司在该领域拥有自己的技术,同时,我们也认为网格计算能够解决现有问题。”他说。IRI公司的做法,使埃克希姆公司坚定了其网格战略。“我们的解决办法更好、更便宜。” 埃克希姆公司运营负责人霍吉斯自豪地说。
为了更好地发展,埃克希姆公司目前正打算把它的数据产品、服务和IT外包业务整合起来,以前这些业务大多独立运行。“我们正尽力放弃每个部门销售各自数据和服务的做法。为客户提供综合性价值是我们的战略。”摩根说。
去年四月,埃克希姆公司在资源共享的思想指导下进行了重组。虽然公司的销售和客户管理部门员工仍然负责具体客户,但IT资源部门的员工,比如数据库程序员,就被集中起来分派到了需要他们的地方。埃克希姆公司认为,正是依靠网格技术,帮助公司实现了这一转变。重组后,埃克希姆公司削减了 5.4%的员工,相当于大约230个人。
当然,业务战略并不是让埃克希姆公司引起公众关注的原因。埃克希姆公司被卷入隐私权事件,提醒每一个人:埃克希姆公司的核心业务就是收集和出售人的数据。
去年九月,捷蓝航空公司把乘客数据转交给联邦政府的做法引起了广泛争议。在这一年前,捷蓝航空公司还向火炬概念公司(Torch Concepts Inc.)提供了150万条乘客数据。火炬概念公司是一家为军方开发军事基地访问者甄别系统的承包商。捷蓝航空公司和火炬概念公司都是埃克希姆公司的客户,埃克希姆公司为火炬概念公司提供抽样数据和社会保障号,与由捷蓝航空公司提供的乘客名单配合使用。
该事件把埃克希姆公司拖入了一场关于公司在什么情况下才能向政府部门提供客户数据的争论中。埃克希姆公司隐私事务负责人詹尼弗·巴里特(Jennifer Barrett)承认,公司的确向政府部门提供了数据,公司还向政府提供隐私事务咨询服务,但她没有透露更具体情况。巴里特认为,政府在隐私事务上所花的精力和执行的政策要比私人部门落后约十年。“所以,当政府部门向公司索要数据时,他们的想法和埃克希姆公司是不一样。”她说。好在政府合同在埃克希姆公司收入中的比重目前还不到1%。
埃克希姆公司把隐私作为公司的核心竞争力,向客户提供隐私事务咨询服务,则是公司业务中获利颇丰的一个部分。埃克希姆公司是最早设立首席隐私官(chief privacy officer)的公司中的一家,有九名员工全职负责隐私事务,并在开展业务的每一个国家都拥有很好的资源。另外,公司法律事务负责人杰尔·琼斯(Jerry Jones)透露说,埃克希姆公司正与几名国会议员合作制定国家的隐私政策。
和隐私相对的则是安全。在这个领域,埃克希姆公司也在努力。公司在2003年末设立了首席安全官(chief security post)一职,任命数据库和数据仓库部门的高级技术顾问弗兰克·卡瑟特(Frank Caserta)出任此职。他的职责是确保埃克希姆公司对数据安全有一个集中的战略,并为埃克希姆公司及其客户的非常好的的数据安全实践而奋斗。
一些客户已经派工作组进入埃克希姆公司对其数据安全措施进行调查。卡瑟特在上任后的最初六个月中,把时间都花在了配合这些审计上。去年四月份以来,他把工作重心转移到了公司治理问题上,研究埃克希姆公司该如何识别和降低安全风险。他不断与客户公司中担任同样职责的同事沟通,采用他们的非常好的实践方法,其中一个方法是聘用第三方公司对埃克希姆公司的IT安全保护进行每年两次测试。“篱笆虽然比以往扎得更牢更紧了,但总还是有进一步加固的空间。” 他说。
对公司的发展来说,同样如此。全球对安全问题的日渐重视为埃克希姆公司提供了新的机遇:那就是提供诸如员工背景调查、是否违反美国爱国者法案(USA Patriot Act)和拒绝电话推销条例(Do Not Call Registry)、诈骗识别等方面的数据。去年二月,埃克希姆公司与它的一个客户,信用数据提供商全联公司(TransUnion LLC)合作,共同向金融服务、保险和电信企业推出了一套预防诈骗和保证遵守相关法令的系统。
收购和全球扩张也是两个重要的发展机遇。去年年初,埃克希姆公司两面出击,以3,640万美元收购了欧洲一家提供消费者数据库的公司肯朔数据公司(Consodata S.A.);此后,埃克希姆公司又以约4,000万美元的价格收购了一家总部设在荷兰哈勒姆(Haarlem)的数据销售公司光明欧洲公司 (Claritas Europe)。这两家被收购的公司构成了埃克希姆公司欧洲业务的基础。
埃克希姆公司可能还有更宏伟的全球计划。刚刚结束在亚洲的长途旅行回到美国的公司CEO摩根说,中国急待发展审核顾客信用的信息系统。在中国,消费者申请买车贷款,需要等上长达几个月的时间。“其中的费用可想而知,其中案头工作则是无法想象。”摩根说。
看来,埃克希姆公司能够、也非常乐意去解决这些问题。
边栏:真正的网格:超越对称多处理
埃克希姆公司CIO迪兹表示,公司10%的IT基础设施已经转向网格架构。
文/ Rick Whiting; 译/Lilly Zheng
在埃克希姆公司位于阿肯色州康威城的庞大数据中心,一排排对称多处理服务器(SMP服务器)正在忙碌地工作,其中就有Compaq ProLiants, DEC AlphaServers, Sun 10000s和SunFire 12000s等各种服务器。然而,这些SMP服务器已经跟不上公司数据整合服务所要求的每天连接10亿条记录的速度。
为了满足日益庞大的数据处理需求,埃克希姆公司自己开发了一种网格计算技术,称为客户信息基础架构技术(Customer Information Infrastructure,CII)。埃克希姆公司CIO迪兹表示,目前,公司10%的IT基础设施已经转向网格架构。
埃克希姆公司从2001年开始开发网格技术,并从一年多前开始全面部署。网格服务器被分成组(Pod),用来来分别处理不同的任务,比如数据管理、工作流程、服务、安全等。每个网格服务器组既可以分配给某类客户或某项任务,也可以作为共享资源从事多项工作。“Pod就像是一台巨型计算机。”迪兹说。
网格又被埃克希姆公司的IT员工称为“蜂巢”(hive)技术,因为机器工作时会发出的昆虫般的“嗡嗡”声。通过网格技术,数台廉价服务器被整合起来像一台机器那样工作,连接它们的则是埃克希姆公司自己开发的基于互联网的操作系统Apiary Rex。埃克希姆公司共有11个数据中心,公司在八个数据中心安装了近4,000个机架式双处理器网格节点。采用的硬件包括戴尔公司(Dell)和惠普公司(HP)的PC服务器,运行的操作系统是红帽公司(Redhat)的Linux操作系统。所用的数据库技术包括MySQL、Netezza和 Oracle。由Ascential软件被用来清理和整合数据,赛仕软件研究所(SAS Institute)的分析工具则被用来分析和测评数据。
CII 技术目前只用来支持Abilitec数据整合服务,但埃克希姆公司计划将它功能扩大到支持外包服务等其他产品。其他一些应用软件,比如用来编制潜在客户名单的软件,可能还会在大型机和SMP系统上运行一段时间,迪兹说。
(信息周刊)