使用关联规则实现交叉销售

发布时间:2018-06-22 14:44 | 编辑:恒全教育 | 291 次浏览
广西臻实项目数据分析师事务所特约分析师 陈虹坚/文一、业务背景交叉销售是企业结合客户需求,提高现有客户客单价的一种营销方式。实现交叉销售对于企业而言意义非凡:一是使销售行为更容易成功,将产品或服务推销给一个现有客户比推销给新客户更容易成功;二是使客户忠诚度增加,经济学上的经验表明,持有两项产品的客户流失率为55%,而持有四种产品以上的客户流失率几乎为零;三是提升企业盈利能力,交叉销售实现在提升销售的同时...

广西臻实项目数据分析师事务所特约分析师  陈虹坚/文 

一、业务背景

交叉销售是企业结合客户需求,提高现有客户客单价的一种营销方式。实现交叉销售对于企业而言意义非凡:一是使销售行为更容易成功,将产品或服务推销给一个现有客户比推销给新客户更容易成功;二是使客户忠诚度增加,经济学上的经验表明,持有两项产品的客户流失率为55%,而持有四种产品以上的客户流失率几乎为零;三是提升企业盈利能力,交叉销售实现在提升销售的同时降低新客户获取的成本,提高单个客户的贡献度,从而实现更高的盈利。

对于企业而言,实现交叉销售,首先需要通过数据分析,发现哪些产品经常被一起购买,进而可以对用户进行推荐,更多时候,需要从海量的购买记录中寻找交叉销售的机会。Apriori算法作为最具影响力的挖掘关联规则的算法,已经被广泛应用在零售、电信及网络监测等众多领域,成为最经典和常用的分析方法之一。

二、Apriori算法

Apriori算法是一种挖掘布尔关联规则频繁项集的算法,使用候选项集通过设定一些指标找出频繁项集。项集是产品的任意组合,频繁项集就是经常被一起购买的产品组合,反映了大部分人的购买习惯。简而言之,Apriori算法是要发现大部分客户一起购买的产品A、B,建立A→B或B→A的关系式。

布尔运算(Boolean)通过对两个以上的物体进行并集、差集、交集的运算,从而得到新的物体形态。算法的基本思想如下:

1.如果一个项集不是频繁项集,那么任何包含它的项集也一定不是频繁项集。也就是说,同时购买产品A和B的人很少,那么同时购买A、B和C的人就更少了。

2.如果一个项集是频繁项集,那么它的任何子集也是频繁项集,也就是说,购买A、B和C的人多,那么购买A和B的人就更多了。

三、Apriori算法的主要指标

Apriori算法有5个关键指标:项集/频繁项集、支持度、置信度、提升度、强关联规则。

指标1、项集/频繁项集

项集是所有产品及其任意组合,一个项即为一个产品或者组合,在多数客户的订单中频繁出现的那些项就是频繁项集。

指标2、支持度

   根据项在全部客户记录中出现的频率,可称为支持度。支持度体现了关联规则的普遍性。

指标3、置信度

对于那些经常被一起购买的产品,他们之间存在较强的关联性,怎么定义关系的强弱,就涉及到置信度指标。

置信度是指客户在持有一个产品(或者一组产品)的前提下,还持有其他产品的概率,置信度体现关联规则的可靠性。

指标4、提升度

满足条件的事件,相比不满足条件的事件,发生增加的可能性。计算公式:Lift(A→B)=CONF(A→B)/SUPP(B)

指标5、强关联规则

诸如A→B,购买A的情况下又购买B的事件,称为关联规则。其中,满足最小支持度阀值和最小置信度阀值的关联规则称为强关联规则,规则即普遍又可靠。

四、Apriori算法的基本步骤

Apriori算法主要包括以下几个步骤:

1.数据输入:按照格式要求准备数据,一般包含用户ID和产品名称两个字段。可同时设定支持度阀值、置信度阀值。

2.生成项值:根据出现的全部产品,生成全体项集。

3.计算项集的支持度:针对每个项,分别计算支持度,同时去除小于支持度阀值的项,得到频繁项集。

4.计算关联规则的置信度:针对频繁项集,建立诸如A→B的全部关联规则,计算置信度,同时去除小于最小置信度阀值的规则。

5.将强关联规则直观展示出来。

6.规则分析:从业务角度出发,分析规则的实际意义,提取具有现实指导意义的关联规则。

五、SAS实现

SAS EM有专门的关联规则挖掘模块,可以交互式操作。一般包括三段代码:

STEP1:为建模创建事物数据库,即为分析准备一个虚拟环境,不产生分析结果。

STEP2:用于生成项集并根据支持度阀值得到频繁项集,当产品项很多时,运算量会较大。频繁项集输出到列表ASC_RESULT中。

STEP3:利用频繁项集构造满足最小置信度阀值的强关联规则,并直观展示出来,输出到列表RLA_RULES中。

部分代码清单如下:

PROC DMDB

DATA=Asso_Datsrc

OUT=_null_

DMDBCAT=Tmp2;

ID Csr_Id;

CLASS Prod;

TARGET Prod;

RUN;

PROC ASSOC

DMDBCAT=TMP2

DATA=Assoc_Datsrc

OUT=Asc_Result

PCTSUP=10

ITEMS=4;

CUSTOMER Car_Id;

TARGET Prod;

QUIT; 

PROC RULEGEN

   IN=Asc_Result

   OUT=Rla_Rules

MINCONF=60;

QUIT;


备注:

1.广西臻实项目数据分析师事务所业务范围:

●投资项目评估、经济效益评价、项目数据处理、项目融资、投资项目策划、社会经济咨询等。

●专业项目数据分析评估:为众多投资人提供专业项目分析服务,减少投资风险;

●撰写项目数据分析报告:为项目方编写项目数据分析报告;

●提供融资服务:项目融资与项目分析工作紧密相连,是项目分析工作价值的体现;

●项目理财策划:项目运营的关健是现金流,是数据真实的体现, CPDA重要的工作是对未来运营情况的判…

2.广西数据分析师探讨交流QQ群:117268053

3.业务咨询电话:0771-5862703/18978862530 韦勋峰经理


(声明:文章来源于网络,不代表本站观点及立场,版权归原作者所有,若有侵权或异议请联系更正或删除)

相关文章

恒全教育声明
从2012年开始,覃韦初、莫恒全教授是“恒全教育”独家特聘的公务员考试专职辅导教师,不再为其他公务员考试培训机构上课。今后凡以覃韦初、莫恒全教授的名义进行招生宣传的,均为虚假宣传,属于侵权行为。请广大考生注意!
声明人:覃韦初 莫恒全
二〇一一年十二月二十五日
快速导航