浅谈数据挖掘在传统行业转型电商中的应用

发布时间:2018-06-22 17:51 | 编辑:恒全教育 | 140 次浏览
​1.引言  随着互联网销售交易量的逐年攀升,越来越多的传统行业开始谋求线上业务的拓展,数据挖掘技术成了帮助传统行业转型成功的利器。通过对线上数据的挖掘与分析,能够帮助企业找准发力点,实现销售额的增长与消费群体的有效维护。  2.传统行业的特征  (1)经营成本高企  传统行业的特点是实体店经营。经营成本相当高,产品投资、店铺装修、铺面转让金、押金,每个月固定支出的铺面租金、税费、人工、水电费、物业保安费...

​1.引言

  随着互联网销售交易量的逐年攀升,越来越多的传统行业开始谋求线上业务的拓展,数据挖掘技术成了帮助传统行业转型成功的利器。通过对线上数据的挖掘与分析,能够帮助企业找准发力点,实现销售额的增长与消费群体的有效维护。

  2.传统行业的特征

  (1)经营成本高企

  传统行业的特点是实体店经营。经营成本相当高,产品投资、店铺装修、铺面转让金、押金,每个月固定支出的铺面租金、税费、人工、水电费、物业保安费等;同时,实体店铺的人流量很大程度上依靠季节转换、天气变化及节假日消费来带动,存在淡旺季之分,淡季就有大批店铺倒闭。与传统的经营方式相比,电商通过降低仓储成本,免去产品陈列场地、导购员、渠道商运输配送等环节,从而能够给消费者提供物美价廉的产品和便捷的购物方式。

  (2)客户群体有限

  传统经营方式受地域影响明显,宣传辐射的范围仅能面有限的时间及区域,投入费用不低,但受众群体有限。电商的经营则不受地域的限制,能够在全国的市场范围内不断开发并维护属于自己的消费群体,营销方式更有针对性,能够节约成本,提高效率。

  (3)营销思维传统

  传统的营销方式中,厂家将产品生产出来后,要经过批发、零售商环节,才能将产品传递到消费者面前,通过电视、广播、报刊杂志、黄页载体等宣传产品信息。而电商的营销思维更注重消费者及潜在消费群体的参与和体验。

  3.传统行业转型电商

  电商送货到家,消费不受时间及地域限制,个性化的商品推荐和价格对比的模式,使线上销售交易额屡创新高,许多传统行业已经迫不及待的要进军电子商务,但因为经验、技术、人才等原因面临诸多问题。传统行业成功转型要注意哪些方面呢?

  (1)线上线下结合

  传统行业在线下的消费群体多取决于店铺所在的位置及周边环境,新消费群体的开发及增强他们的粘性可以考虑用线上的渠道来进行。通过微博、微信、邮件、短信等方式,把线上的流量引入到线下的销售渠道中,通过会员制、虚拟货币、积分体系、经验值等将线上线下消费群体关联起来,就有可能实现销售额的爆发式增长。

  (2)数据挖掘与分析

  传统行业转型电商还要重视数据挖掘技术的应用。线上每天产生的数据量十分巨大,访客们来了又走,他们浏览过什么页面,消费特征是怎样的,对产品有什么偏好,最可能对什么活动感兴趣等,都是宝贵的资源,需要使用数据挖掘技术对线上产生大数据进行分析、分类,从而找出最有可能进行消费的潜在群体,将产品信息告知他们,实现营销的精确性。

  4.数据挖掘的主要技术

  数据挖掘的常用方法和主要技术有神经网络、决策树、关联规则、贝叶斯分类方法、回归、主成分分析、聚类、假设检验、时间序列等,本文主要介绍回归、聚类和时间序列这三种。

  (1)回归

  回归分析在电子商务中应用得较多的有Logistic回归和多元线性回归。

  Logistic回归能够较好的进行预测和判别分析,在当前受到广泛应用,但是使用中需要注意若干问题,首先数据量要达到一定的规模,其次应当注意删除异常值,再次缺失值应该进行恰当的处理。

  多元线性回归模型以其简单易懂的模型和较快的计算速度等优势在电子商务中被广泛应用,但在使用中也需要注意若干问题。第一,计算之前需要对噪声进行处理,才能保证模型的稳定性;其次,多元线性回归只能够处理线性关系,如果两个变量之间呈现明显的非线性关系,则不适合使用该算法。

  (2)聚类

  聚类分析属于探索性的分析,能够依据研究对象特定指标的相似程度将其进行分类,在电子商务中主要应用于目标用户的细分、产品的营销组合以及风险控制等方面。主要的聚类算法有层次、划分、密度、网格和基于模型的聚类。其中划分聚类的主要算法有k-means,EM,k-medoids等,在电子商务中属k-means算法的应用最为广泛。同样的,k-means算法在应用过程中也需要注意以下几点:第一,算法本身有其局限性,因此在处理数据时需要特别留意异常值对平均值的影响,可以使用随机抽样的方法或考虑删除异常值来进行解决;第二,为了保证聚类结果的准确性,需要在数据预处理阶段对数据进行标准化处理;第三,分析中,需要结合业务特点及分析需求设定简洁有效地变量指标,避免变量过多而造成结果失真。

  (3)时间序列

  时间序列用于分析基于时间既定周期的一般规律或发展趋势,影响它变化的因素主要有长期趋势(一般用T表示)、季节变化(S)、周期变化(C)、随机变化(I)这四个方面。时间序列较常用的模型有乘法模型和加法模型,两种模型分别如下:

  乘法模型:Y=T×S×C×I 加法模型:Y=T+S+C+I

  常用的时间序列的算法主要有趋势外推法、移动平均法、加权移动平均法、指数平滑法和季节分解法等。

  5.数据挖掘的常用工具

  目前市场上的数据挖掘工具种类繁多,较常用的有SPSS Clementine、SAS Enterprise Miner、Oracle Darwin、IBM Intelligent Miner、Unica PRW等,本文将主要介绍SPSS Clementine和SAS Enterprise Miner这两种。

  (1) Clementine(SPSS)

  Clementine是SPSS公司的数据挖掘软件,操作界面友好,可视化能力优越,分析功能强大,只需要简单操作就能完成较为复杂的挖掘工作。其中Clementine 12 中提供的算法有回归、神经网络、决策树、时间序列、贝叶斯网络、主成分分析等累计27种,而且根据分析的目的进行了相应的分类,例如预测类的、关联类的、细分类的等等。只要明确了需要解决的问题以及所使用的算法,就能够根据Clementine对模型的分类,找到合适的模型。

  (2)SAS Enterprise Miner

  SAS Enterprise Miner整合了SAS统计模块的实力,能够进行回归、聚类、决策树、关联、神经网络、路径分析等数据挖掘技术。操作界面简介明了,只要通过简单的拖放操作就能实现数据挖掘的功能。主要过程大致分为五个部分,对数据进行取样—挖掘—修改—模型的构建—模型评估。在每一个环节中,SAS Enterprise Miner会根据挖掘项目的进程,提示分析人员进行下一步操作,最终生成结果。

  6.结语

  传统行业在进行转型的过程中,需要重视数据挖掘技术在经营战略及产品营销中的作用,培养一支能够结合自身业务进行大数据的挖掘与分析的团队和一批优秀的数据分析工程师们,才能够为企业的成功转型保驾护航。

  温馨提示:欢迎同行加入广西数据分析师群探讨交流QQ群:117268053


相关文章

恒全教育声明
从2012年开始,覃韦初、莫恒全教授是“恒全教育”独家特聘的公务员考试专职辅导教师,不再为其他公务员考试培训机构上课。今后凡以覃韦初、莫恒全教授的名义进行招生宣传的,均为虚假宣传,属于侵权行为。请广大考生注意!
声明人:覃韦初 莫恒全
二〇一一年十二月二十五日
快速导航