【IT168信息化】
本月早些时候在纽约召开的Hadoop世界大会上,一些IT执行官们指出,尽管用户还存在着一些安全等方面的疑虑,但是Hadoop已经为大公司的使用作好了准备。
摩根大通管理总监Larry Feinsmith在主题演讲中称,在三年时间里,金融服务公司逐渐加大了使用开源存储和数据分析架构的力度。
Feinsmith称,目前摩根大通在交易处理中仍然在很大程度上依赖关系型数据库系统,但是他们已经开始使用Hadoop技术以满足日益增多的用途,包括诈骗检验、IT风险管理和自助服务。
他称,目前公司有约150PB在线存储数据、30,000个数据库和35亿个用户登录账号,这些数据是摩根大通的生命线,。
Hadoop能够存储大量非结构化数据,允许公司收集和存储Web日志、交易数据和社交媒体数据。他称:“Hadoop允许我们存储我们以前无法存储的数据。”
Feinsmith称,数据被汇集至一个通用平台,以方便以客户为中心的数据挖掘与数据分析工具的使用。
与此同时,易趣也开始使用Hadoop技术和Hbase数据库(支持实时分析Hadoop数据)为其拍卖网站创建一个新的搜索引擎。
易趣体验、搜索与平台型业务副总裁Hugh Williams称,新的引擎被命名为Cassini,未来将替代公司在本世纪初使用的技术。这一更新部分原因是为了处理急剧增长的数据。
他强调,易趣已经拥有超过9700万活跃的买家与卖家,在5万个门类中有约2亿个交易项目。网站每天处理大约20亿次的网页浏览、2.5亿次的搜索查询以及数十亿次的数据库调用。
Williams称,公司已有9PB数据存储在了Hadoop和Teradata群集上,而这一规模还在持续快速增长。大约100名易趣工程师在为Cassini项目工作,这使得该项目成为了公司最大的发展项目。将在明年启用的新引擎预计将为用户查询提供更为精确的结果。
Feinsmith警告称,对Hadoop感兴趣的电商应当意识到潜在的安全风险。他解释称,在带来数据私利与数据所有权等问题的同时,多源数据的汇聚与存储还将带来大量涉及访问控制和数据管理方面的问题。
Feinsmith已经列出了Hadoop的一些潜在缺点,用户在将Hadoop用于大型项目之前应当清楚这些缺点。
比如,Hadoop市场非常“混乱”,厂商、产品和标准经常发生变化。此外,熟练的Hadoop工程师非常缺乏。
Williams也指出,Hbase等相关技术仍然还未成熟,这引发了对系统稳定性的担忧。
不过,Hadoop有非常大的潜力。Feinsmith称,摩根大通的IT员工对于关系型数据库技术是否能够满足他们的大数据需求,以及基于Hadoop的系统是否能够被用于交易处理还存在着争议。(范范编译)
本文转载自企业级IT信息服务平台-网界网-CNW.com.cn
原文地址:http://www.cnw.com.cn/news-international/htm2011/20111129_238286.shtml