信息化 频道

别太迷信数据挖掘

 

    沃顿商学院定量营销领域Peter Fader教授告诫CIO,收集太多的客户数据有时候对公司的业务并无多少帮助,而错误地使用数据挖掘工具,甚至会给企业经营带来相当大的负面影响。

    作为美国宾夕法尼亚大学沃顿商学院营销学领域的著名教授,Peter Fader擅长于用消费者的行为数据对企业的销售额做预测并进行客户关系管理,他还因此获得了很多奖项。即使如此,Peter Fader最为世人所熟知的可能还是他在2000年7月作为专家证人在旧金山地区法院所做的有关Napster网站音乐销售额激增的证词(当时Napster网站因为侵权行为而被几家大的音乐公司起诉)。

    Peter Fader给人的直观印象是精神饱满且极具魅力,同时,他对很多公司浪费时间和金钱来做一些不可能实现的目标的行为深恶痛绝。对此,Fader研究了一个替代性方案:建立在概率模型基础上的数据挖掘。当前,他正在大学里向学生讲授他的研究成果,而且他还认为这一方案在企业的实际操作中出人意料地简便易行。

    CIO INSIGHT杂志社记者近期采访了Peter Fader,与他就如何借助概率模型使商务变得更智能化进行了交流。

    CIOI:你认为对企业来说,数据挖掘工具有哪些优点,又有哪些不足之处?

     Fader:在对人群进行分类时,数据挖掘工具是一个不错的选择。借助数据挖掘工具,可以很容易区分出哪些人的信誉较好、哪些人的信誉较差;什么原因使人们分别加入共和党和民主党?要想做这样的工作,我实在找不出还有什么比数据挖掘工具更合适的方式,而且我认为做这些事情时投入一部分钱也是合情合理的。但是需要特别注意的是,对于企业来说,很多时候消费者购买哪件商品并不重要,重要的是他们何时会购买?多长时间之后才会再次购买?我们刚才提问的这些问题靠数据挖掘工作很难得到正确答案。数据挖掘工具比较擅长分析某一行为是否会发生,但它在分析这一行为何时才会发生时就显得无能无力。

    “数据模型的建模程序是建立在几个假设的基础之上的:人们做事情有时候是一种随机性的行为;这种随机性的特点可以由简单的概率分布表示出来;人们购物的倾向性因时间、人物和环境的不同而有所差别。”

    在分析一些对时间较具敏感性的商品时,数据挖掘工具的效果更为显著,比如圣诞节期间,零售商通过分析一些相关数据可以出售容易获得消费者青睐的商品。但当你不只是想预测接下来某些特定消费者想购买哪些商品,而是想进一步分析一下他们的购买行为时,你可能就需要一些特别的分析工具。因为人们在做一件事的时候,具有很强的随机性,所以仅靠数据挖掘工具来收集消费者的600个不同的行为变量并不能有效地捕捉到他们的行为。
   
    很多人一直认为,如果我们收集消费者的更多数据、更加深入地理解他们的消费心理和行为,就可以解决在进行预测时所有不确定性的问题。其实,现实情况永远不会像大家想像的这么简单,因为人们的消费行为通常是很随机性的,仅是借助数据仓库不可能捕捉到他们的消费行为。有时候,人们购买一件商品的动机可能是因和恋人发生了争吵而借购物来消气;也可能是一个小孩在玩球的时候伤了自己的脚踝因此需要一些药品来止痛;也极有可能是有人在看电视时看到了某件产品而激起了其购物欲望,这些行为都是随机性的,很难进行预测。所以我建议一些企业与其继续扩大数据仓库的规模,还不如就此举白旗投降,甚至对它都不要抱任何幻想,连试一下的念头都不要有。

    CIOI:你认为一些企业的主管了解到了数据挖据工具的局限性了吗?

    可以遗憾地说,他们还没有。出现这样的情况和数据挖掘以及市场营销并无关系,更大程度上是和人的本性有极大关联。现在,在各门科学领域,我们能看到这种情况经常发生。随着数据采集技术的不断发展和人们建模能力的增强,很多人认为他们可以借助数据挖掘工具回答原先所不知道的问题。但是也可能是技术上还有不少有待提高的地方,也可能是人们在理解方面还存在偏差,其实数据挖掘工具在我们寻找数据方面所能提供的帮助并没有大家想像的那么巨大。

    CIOI:如果公司错误地使用了数据挖掘工具,对它们自身会带来哪些损害?

    首先我告诉你一个正面的例子。我特别钦佩保险公司的那些精算师,因而对保险公司对待客户的方式也非常佩服。精算师们无需观察客户所有的个人特征就能预言客户将会去世。然后,他们会得出一个可能的结论,即所有具有
某一类特征的客户都将会去世,或者共同拥有某一特征的客户能够活到70岁的比例大概是多少。他们明白不可能对每一个投保人都做这样的陈述,所以他们通常会对一群人的特征进行分析。

    现在,试着将保险公司的那一套做法放到其他企业的营销中来。很多公司都在讨论“一对一”营销,其实我
并不认为这种营销方式对公司的业务会有积极的帮助,相反,它可能更多地会损害企业的业务发展。只有当企业在与每一个客户都建立起紧密联系时,“一对一”营销才会发挥它的效果。只有在进行个人财富管理或在B2B商业模式下企业一个月最少与客户接触一次时,“一对一”营销才会起作用,因为在这种情况下,企业不仅能了解客户的业务需求,也能在某种程度上掌握他们生活中的一些信息。但是当面向大众市场时,“一对一”营销就显得无用武之地,因为在这样的市场环境下,企业面对的是一群客户和有关他们性格特征的一组分析。在这种状况下,“一对一”营销对企业业务所带来的通常是弊大于利,因为客户的行为比企业想像的更为随机。如果企业还试图推算出特定客户的购买习惯,你最终得到的收益将远远低于你最初的投入,这样就会吃力不讨好了。

    仅凭数据挖掘工具是很难推测哪位顾客将要购买某一件商品、他的消费行为可能发生在什么时候的。有时候,为了消除这种不确定性,很多人可能会拿两种产品进行比较,并将比较结果扩展到更多的产品,还会说“它们两者具有非常强的相似性”,然后在这一基础上做一些错误的预测。这样的预测行为对公司来说是非常有害的。对公司来说,寻找到自己固定的客户群是非常重要的,然后可以将他们视做一个群体并对其做相应的产品方面的营销。

    其实,我并不想特别挑选亚马逊作为一个例子来说明数据挖掘对企业的危害性,但它经常夸耀其推荐系统的行为又让我不得不说两句。有时候消费者可能想在亚马逊网站上购买B书,但是其推荐系统推荐给消费者的却是一些不相关的信息;抑或消费者本来想购买对亚马逊来说能获得更高盈利的C书,这样推荐他们去买B书又是一种错误行为。如果推荐系统经常给出这些消费者并不需要的信息的话,就有可能使一部分消费者流失掉。当然,我并不是说企业不应该采取交叉销售的方式,我只不过是在强调它能为企业带来的利益远远没有人们想的那么高。这就说明了其实企业没有必要在交叉销售领域进行投资,因为最终所投资金可能会打水漂。

    CIOI:你刚才提到相比较于数据挖掘工具,概率模型可能会给企业带来更多价值。请你简单阐述一下概率模型的内涵?

    概率模型是以前数据量很小的时候,人们经常使用的一种模型。它的建模程序是建立在几个假设的基础之上的:人们做事情有时候是一种随机性的行为;这种随机性的特点可以由简单的概率分布表示出来;人们购物的倾向性因时间、人物和环境的不同而有所差别。在这方面,大概最有名的例子是生存分析,其实它很大程度上是从精算学发展而来的,而且它在制造业中也有应用。假设你把一串电灯泡放在实验板上,观察一下它们能亮多久。其实,这也是我经常建议企业对待顾客的方式。在这种情况下,我们不会对每一只灯泡都进行阐述,就像我们不会对每一位顾客的消费习惯和特点都做出阐述是一个道理。我们通常会对这些灯泡中有多少可以持续亮1000个小时做一个集中阐述。

    令人惊讶的是,制造业中生存哲学与精算学的这种相似性在客户身上得到了很好的体现。对这一观点,很多经理可能会持反对意见。不过我认为这样的比喻比现在盛行的定制和个性化要好很多。其实,就像灯泡一样,顾客之间有非常大的差异性。但是因为某些原因,我们还没有区分出这些差异性,或者是没有花费时间好好利用顾客之间的这些差异。

    CIOI:概率模型能解决哪类问题?

    概率模型有三个基本的组成部分:第一个时间变量—某一事情发生之前大概需要多长时间;第二个是额度变量—有多少到访者、到访者中有多少人会购买某产品、在某一特定时间内我们需要特别关注什么;第三是选择变量—如果给人们一个机会做某件事情,他们会选择做什么。这就是全部的问题所在。大部分现实世界中企业所遇到的商业问题都是这几个方面共同作用的结果。例如,如果你想就某一特定月份人们花费在互联网上的所有时间做一个模型,你可能会将它做成一个额度变量—时间变量模型:额度变量代表的是到访者的数量,而时间变量则代表了每个人在网上所呆时间的长短。我认为我们可以在EXCEL表格里面建立概率模型三个组成部分中任何一个简单模型。在过去几年,很多人已经建立了这样的模型,并进行了很仔细的测试,而且在很多情况下它都打败了数据挖掘工具。很多使用者还发现,概率模型的作用不仅是惊人的,而且要远好于数据挖掘工具。如果你可以把时间变量、额度变量、选择变量整合到一起,你就可以从中发现很多不同商业情景下的有趣故事。

    CIOI:你认为该如何利用这些工具来识别对企业来说最有价值的顾客,或者利用它来计算顾客的终身价值呢?

    我认为要想实现你所说的目标,企业应该将概率模型和数据挖掘工具结合起来使用。我们使用这些模型,可以得出我们能在多长时间内留住顾客,或者他们明年将会购买多少物品的预期。因此,使用基本的概率模型可以掌握顾客基本行为方面的数据,然后借助数据挖掘工具分析这些数据,就能够理解为什么具有不同行为倾向的顾客之间有如此大的差异。可以看出,行为本身并不代表着顾客潜在的消费倾向,这一点正好是经理们想知道的。因此,我们建立概率模型可以帮助我们揭示顾客的这些倾向,然后我们将消费者购物的快慢,以及是否会停留很长时间的倾向这样的分析结果放到数据挖掘工具里面继续分析,这样我们就可以用数据图表(或量变曲线)表示新顾客的状况,并可以更好地理解一些老顾客的行为。所以先用概率模型分析消费者的行为,得出结果后,再借助数据挖掘工具做进一步的分析,通过这
样的分析方式,就可以找到对企业来说最有价值的顾客,并能计算出顾客的终身价值。

    CIOI:你认为CIO要想在企业中正确使用分析和模型工具该注意哪些方面?

    首先,CIO一定要意识到量多并不一定会使事情变得更好。那些增加的数据有时可能会对企业带来损害,因为企业将要抓取的消费者的数据是随机的、多变的、非常有特点的,有时候并不会和正确的潜在预期相关。其实,对一家公司来说,像购买时间和购买频率这样简单的计算措施一直是它需要的。

    “CIO要牢记有些看似非常简单的模型可能会给公司带来巨额效益,而其中借助这些模型掌握消费者的行为又是非常关键的一步。”

    其次,CIO要牢记有些看似非常简单的模型可能会给公司带来巨额效益,而其中借助这些模型掌握消费者的行为又是非常关键的。因此你要先从简单模型开始,这也就意味着要从关注Excel表格开始。通过表格获得几次成功后,你可能就会为自己没有放弃制表环境而感到庆幸。

转自《CIO Insight》

0
相关文章