去年,美国的电子零售巨头亚马逊宣布了一项新的专利:“预判发货”。即在网购时,顾客还没有下单,亚马逊就将包裹寄出。这种顾客未动、包裹先行的做法,这就是大数据在企业经营中的应用。发货的根据是顾客以前的消费记录、搜索记录以及顾客的心愿,甚至包括用户的鼠标在某个商品页面上停留的时间。
这种突出的技术就是大数据的数据挖掘。数据挖掘是指通过特定的算法对大量的数据进行自动分析,从而揭示数据当中隐藏的规律和趋势,即在大量的数据当中发现新知识,为决策者提供参考。数据挖掘进步的根本原因是人类能够不断设计出更强大的模式识别算法。正是通过数据挖掘,各大商家谱写了不少点“数”成金的传奇故事。
那么,到底是怎样来做数据挖掘的呢?
我们用一个10几年前案例,沃尔玛通过捆绑“啤酒和尿布”提高销量的故事,来向大家做讲解。
在案例说明前,先要搞清楚数据挖掘的三个基本概念,即:“数据”、“信息”和“知识”:
◆“数据”是信息的载体,如:28;
◆“信息”是有背景的数据,如:广州温度28摄度度;
◆“知识”是呈现规律的信息,如:广州秋季的平均温度为28摄氏度;
数据挖掘就是:从“数据”到“信息”再到“知识”的模型。
数据-->(赋予背景)-->信息-->(提炼规律)-->知识。人看到“知识”后产生灵活应用,即“智慧”。
我们回到沃尔玛“碑酒+尿布”的案例。在欧洲一家沃尔玛店收到一个有趣的信息:周五晚上尿布销量在一周尿布销售总量中占很大比例,于是,通过计算机从数据库中提取顾客消费记录,建立“数据”至“智慧”的五个层级。
1、数据。收集有关顾客购物的交易数据,包括如下的数据元素:货物名称、数量、价格、日期等(见表1.1)。
表1.1 交易数据实例
2、信息。通过计算每种货物的销售额,就可以进行货物销售额排序。
表1.2 数据积聚形成信息
3、分析。将不同的数据元素积聚形成信息是很有用的,同时,将数据分离和重新组织将能够提升信息的价值,这就是进行信息分析的意义。例如,可以对存储的信息按照特定的时间周期进行分析,可以得到有价值的分析结果,尿布和啤酒的销售受到时间周期的影响,而谷物、面包和牛奶则保持稳定的销售态势。
表1.3 对信息的分析
4、知识。知识可以来源于数据、信息和分析的任一层次,同时也可以从现有知识中通过一定的逻辑推理而得到,最终从数据中发现隐藏的趋势以及不寻常的模式。
通过对数据进行称为规则归纳的数据挖掘,可以得到如下一条结论:买尿布的顾客通常有一半时候也买啤酒。尿布和啤酒初看起来毫无关联,但是通过数据挖掘得到了这种隐含的模式,这就是知识。
5、智慧。智慧可以说是基于知识基础上的一种判断、谋略或行动。通过对数据的挖掘分析,得到了一种隐含的顾客购买模式。通过这个知识,店主就可以对数据集合进行调查分析,从而开发一系列的销售模式(见表1.4)。