【IT168信息化】“智慧的工厂、智能的产品”为主题的中国制造千人会2016暨第二届互联网+制造高峰论坛(以下简称论坛)在沪召开。论坛现场发布了中国电商消费者2015最具亲和力产品报告,这是国内首个通过大数据分析消费者真实购买行为和真实用户评价的“中国电商消费者2015最具亲和力产品”,由京东大数据,LKK洛可可和ZD至顶网三方联合对外发布。
来自京东大数据赵睿敏就京东的大数据作了详细的介绍。赵睿敏指出,京东数据包括两种一是结构化数据,二是非结构化数据,非结构化数据指的是文本信息、图片、语音信息之类的数据,主要来自三个方面:京东集团自有采购数据,开通开放供应链数据以及行业咨询和网络的数据,所有的数据利用之前都要进行清洗,才能提供给上层的应用层。
京东每天大量数据,我们会确保数据安全,建立隐私数据库,工作人员做过的一些动作,会有日志的记录,最终可审查。使用方面我们的相关人员必须接受培训,经过培训并且是考试合格以后才有资格申请一些数据的使用,我们还会建立安全制度,经过培训,贯彻数据安全的意识和相关的人员签订数据保密协议。
关于这次评选重点参考的就是商品,然后商品页面上用户评论信息以及好评率,产品好不好只有用过才知道,所以用户是最有发言权的,某款产品有一个评论数的展示,指的是这款商品从销售以来累积的评论数,通过大数据的相关技术,对这些评论信息进行挖掘,再结合用户在提交评论的时候对这个商品打分,我们会分成中评、好评和差评三个等级,右边会有一个买家印象,这里面展示的内容也是从用户的评论信息里面,抓取的一些具有典型的代表性的关键词,按照出现的频率进行一个统计。
不同的关键词代表这个产品不同的方面,比如说它有关于产品的质量方面,有关于外观设计方面,然后我们通过这次评选的主题,结合专家的意见,对这个商品进行一个综合的打分,中间也会结合好评绿选出佼佼者,这些评论信息的展示有助于我们用户在选取商品的时候,可以有效的对商品进行比较,辅助我来决策我是否最终下单,提高转化率。京东是非常鼓励用户评论的,从右边会看到,如果用户发表评论的话,会有一个相应的奖励机制。
我们积累了大量的文本性的用户评论信息,怎么来用这个东西,这些评论信息组成了一个库,通过非结构化数据分析的技术,对这些语句把字抓取出来,然后再进行语义分析,将这些字分成属性词和情感词。将形容词组合在一起,对关键词出现的频次进行一个统计。
某购买手机用户的评论信息,抓取的信息做的展示,从这里可以看出,用户除了关注外观漂亮,还会关注性能的东西,而且关注点很多,大家会看到出现各种各样的关键词。而且我们发现越是用户心目中的明显产品,出现的各种不同的类型的关键词越多,通过这种技术我们对文本的挖掘与关键词的截取,我们可以从这些评论里面发现这些产品的闪光点在哪儿,从而预估市场潜力是怎么样的,并且进一步指导我,对这个商品运行。
随着电商行业发展的成熟,现在电商的竞争不再是价格战而是服务战,谁能够更好的服务于用户,提高用户的体验,谁就可以更快的占领市场,我们怎么样更好的服务顾客,我们必须了解顾客,我们就出现了用户画像,京东用户有一个行为日志,每天储存数以亿计的用户来访,通过大数据对这些信息进行挖掘和分析,从而挖掘出用户的偏好和行为习惯,进一步勾勒出用户的形象是怎么样的,你有哪些行为特点,可以进一步还原这个用户特征,属性背景,甚至可以挖掘内心特点。
我们现在通过给用户打标签这种方法描述这个人群,不同的标签代表了用户不同方面的特点,比如说这里面的性别、年龄、教育程度,主要就是反应了用户的属性的特点,比如说购物类型,主要是代表用户在购买商品时候的性格特点,比如说你是冲动型的人群,还是购买商品的时候比较偏理性,这个就是用户的一些心理特征方面的一些标签。还有颜色偏好和品牌偏好,这就反应了用户的兴趣喜好的东西。
用户画像现在应用的方向,在哪些方面有设计到应用,比如说这里面有推荐,智能机器人这些。其实用户画像最直接的用途就是帮助我们找到我们的目标用户,然后进一步的指导我们的市场进行精准应和数据化推荐,比如说用户购买性格特点的时候,比如说你的用户是属于比较偏冲动型的,我们就会给你推荐一款什么商品呢,就是现在畅销的商品,如果你是偏向理性的,那么我们就会给你推荐口碑比较好的商品,右边这个图就展示了用户画像。之前在邮箱营销时候我们是大撒网、广捞鱼的方式,效果并不好,我们利用用户画像进行邮箱营销的时候,开信率和转化率都有明显的提升。
我们怎么把这些数据用好,发挥京东大数据的价值体现,京东大数据的优势,我们用好了这些数据可以有效的提升我们的用户体验,进而降低我们的运营成本,降低供应链的成本,提高我们整个的运营效果,现在我们提出一个京东大脑的计划,这个架构分为三部分,一部分是基础数据部分,一个是只是层,一个是服务层,数据层是属于最底层,主要用来存储我们京东海量的生产的数据,属于比较基础的层面。知识层对基础数据加工,这些数据可以更好的为上层进行决策。服务层是最底端,利用数据,可以进行某些方面的预测。
这次双十一用户消费特点为例,我们发现现在的用户不仅仅是关注低价值的东西,更多的是关注品质,我们对双十一那一天,按照销售金额,然后对不同的品类进行了一个榜单排行,这里面展示4个,从这4个品类可以看出来,排在前几名的都是大品牌,以耳机为例,现在进入科技时代,很多用户关注音效质量怎么样,外观够不够炫酷,就说明用户很关注品质的。
其它方面我们和去年的双十一的数据进行了对比,发现了一些微妙的变化,购买力是说用户在京东的消费能力,根据这个我们把用户分成了土豪级别和高级白领用户,都在不断提高。年龄层36到45岁层面有所提高,大家更信任京东,投入更多的资金购买商品。
消费心理上,理性比较型和目标明确型用户占比明显增加。今年的用户选购商品的时候,更多的人开始关注评论度。我们对用户在不同的品类,同样的一个人然后不同的品类表现出来的消费者行为也是不一样的,现在的智能产品智能的特点,功能很独特,是的这类商品很具有个性,我们对智能产品的消费者人群进行了研究,智能产品它的消费人群以男性为主,聚集在华东、华南这个地方,购买力也很强,消费能力很强,而且具有很时尚的消费态度,追求生活品质。正是因为智能用户,有这样的鲜明的属性,也决定了具有独特的购物行为。
购买智能产品的用户,购买商品的时候更加理性,购买决策时间更长,目标很明确,他在购买商品的时候,下单之前,对比商品的时候,个数不是很多,而且就是智能商品的用户和普通用户,进行比较一般在上午有一个明显峰值,而且智能用户购买能力偏强一些,红线就是智能用户,在智能用户中,我们这里面显示了智能用户在不同的终端上,用户的客单价的分布,发现在苹果的用户,更为优质。
在移动端这些终端上,我们发现很多用户基本在深夜的时候访问页面,iPad用户在这方面人群分布会更多一些,我们将分为了高价值、中价值、低价值用户,不同品类下按照用户分类,不同分类下的用户,购买商品的中高低段商品的占比分布进行了一个排比,我们就会看到,不管是哪类用户,不管是高价值、中价值、低价值用户,还是更多的会关注中低端的商品。
我们按照智能产品所有的商品的好评、中评、差评进行了占比的分布,智能产品好评率不是特别好,和其它商品比起来好评率比是很高。所有的评论基本上侧重产品的功能、质量、物流配送等环节,好评率还是偏低的。