信息化 频道

阿里巴巴首席架构师谈海量数据分析平台

  【IT168 信息化】

  4月16日,2011数据库技术大会在京召开,来自在2011数据库技术大会的商业智能、数据分析专场上来自阿里巴巴数据仓库部首席架构师 姜迅 就阿里巴巴 海量数据分析平台作为了精彩的主题发言。

  姜迅详细的介绍了阿里巴巴B2B业务的海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现等

阿里巴巴首席架构师谈海量数据分析平台
▲阿里巴巴数据仓库部首席架构师 姜迅

  姜迅称,阿里巴巴2007年到现在,数据量翻了150倍。

阿里巴巴首席架构师谈海量数据分析平台
▲数据分析1

  WAL

  (用户研究与用户信息服务)

  基于用户信息与行为的挖掘分析实现对用户偏好及特性。

  PKL

  (文本挖掘与产品知识库)

  基于产品信息、产品交易的挖掘分析实现对产品属性及产品关系的解析与标识
  RE

  (个性化推荐算法与服务)

  基于用户及产品的特征、相关性及BT、内容匹配等推荐算法的个性化推荐系统。

阿里巴巴首席架构师谈海量数据分析平台
数据分析1

阿里巴巴首席架构师谈海量数据分析平台
▲数据分析2

 阿里巴巴首席架构师谈海量数据分析平台
▲数据分析3

阿里巴巴首席架构师谈海量数据分析平台
▲计算两两频频繁相集

阿里巴巴首席架构师谈海量数据分析平台
▲模型优化

  演讲嘉宾:姜迅:阿里巴巴B2B 数据仓库部首席架构师

  阿里巴巴B2B 数据仓库部首席架构师,资深专家

  阿里巴巴B2B 大数据部技术委员会主席

  阿里巴巴数据仓库首席架构师,负责阿里巴巴数据仓库系统架构,解决方案的相关工作;数据库、分布式数据库、分布式计算模式/框架的专家;互联网数据模型专家;多年大型数据仓库架构,模型设计以及系统调优的实践经验;关注于互联网海量数据的信息抽取,数据挖掘以及通过分布式框架进行的具体实现。

  2011数据库技术大会已经是IT168、ITPUB、IXPUB、ChinaUnix联合主办的第二届数据库技术会议了。2010.4.2~4.3两天,我们成功举办了第一届数据库技术大会,参会规模达到了700人,大会聚集了国内最优异的数据库专家,是国内数据库工程师、架构师们一年一度的盛会。

  在已经举办完的2010数据库技术大会里,数据库专家(演讲专家、CTO、首席DBA、知名数据库图书作者等)超过了150位,而其他参会者也是数据库领域的资深骨干工程师。

0
相关文章