数据挖掘功能之四_关联分组_戴稳胜

01-31

数据挖掘功能之四：

关联分组

文／戴稳胜　张阿兰　谢邦昌

关联分组是指在所有的对象当中把相关的对象放在一起，它描述的是数据间的密切关系。广义上讲，关联分组所寻找的密切相关的关系包括两种类型，一种是同一时间内几个数据项或事件同时发生或共同出现，比如经典的“啤酒与纸尿布”的故事，另一种是某些事件或数据项呈先后顺序有规律地发生，比如“移动通讯顾客当月消费额下跌３０％，则两个月后该顾客就会流失”。

关联分组通常用于市场营销中发现捆绑销售或交叉销售的机会，从而设计出吸引顾客的产品群。比如某保险公司发现“购买长期意外险的３０岁以下男士通常会在三年后购买幼儿医疗险”，该公司客服人员就可以每年专门针对那些三年前购买过长期意外险的人进行幼儿医疗险的推介活动。再如某旅游公司发现其会员预定外出旅游活动后，９５％的人会订购相应的野外生存用具，则该公司就可以提供旅游活动与野外生存用具的打包销售以获取收益并为其会员提供便利。目前的实证研究中还发现过“某公司财务报告中某指标上升１％，则一个月后其股票价格会上涨”这样的规律，这种规律的价值当然不言而喻，发现规律的公司对此当然会讳莫如深。

关联分组通常依赖于关联规则分析及顺序关联规则分析，常用于解决关系规则分析的算法包括ＡＰＰＲＩＯＲＩ、ＧＲＩ等，常用于解决顺序关系规则的算法则包括

ｓｅｑｕｅｎｃｅ　ａｎａｌｙｓｉｓ和ＣＡＰＲＩ，但两者在统计意义上的基本原理一致，以下不再作区分，简称“关联规则”分析。有兴趣的读者可以阅读相关算法研究的文献。

做关联规则分析及使用关联规则前首先要了解，关联规则是一种单向的关系。比如关联规则“Ｘ→Ｙ”表示，当Ｘ事件发生的时候有发生Ｙ事件的趋势，但反过来讲就不一定成立。这里Ｘ事件与Ｙ事件的含义很广泛，比如可以表示“购买的物品里有啤酒”、“股市上升一个百分点”、“顾客流失转向竞争对手”等等。

关联规则按不同的标准可以分成不同的类别。常见分类包括以下三种。

１．按关联规则中处理的变量类别，可以分为布尔型和数值型

布尔型关联规则中两边变量都是离散变量或类别变量，　比如“买啤酒→买婴儿尿布”；　数值型关联规则处理的是数值型变量，如“年均收入为１０万元→年旅游费１．５万元”。但是实际上，关联规则本身不能处理连续型数值变量，寻找这类变量的关联规则前要将数值型变量离散化，比如将收入层次划分为高、中、低、上升、持平、下降等取值后再进行处理，所以有时关联规则的挖掘与进行模糊预测共同进行。

２．按关联规则中数据的抽象层次，　可以分为单层关联规则和多层关联规则

单层关联规则是指规则没有考虑现实世界中数据的分层，　而多层关联规则则充分考虑了数据的多层性。比如“买啤酒→买纸尿布”是一个细节数据上的单层关联规则，而“买蔬菜→买苹果”是一个较高层次和细节层次间的多层关联规则。

３．按关联规则涉及变量数可分为一维与多维关联规则

一维关联规则只涉及数据的一个维度（即一个变量），如用户购买的物品；而多维关联规则要处理多维数据，涉及多个变量。单维关联规则处理单一属性中的关系，而多维关联规则处理的是多个属性间的某些关系。比如“买啤酒→买婴儿尿布”只涉及用户购买的商品，属于单维关联规则，而“喜欢野外活动→购买慢跑鞋”涉及到两个变量的信息，属于二维关联规则。

任何两个变量间都可能存在潜在的关联，怎样判断关联规则的有效性呢？可以从两方面看，一方面可从顾客角度看。直观上讲，一个好的关联规则至少有两个特点，一是它要有用，因为数据挖掘本来的目的就在于应用；二是它还要出乎人们的意料，如果是一般常识性的东西那它就没什么价值了。另一方面是从技术角度看，只有那些满足一定技术要求的规则才能展示给用户，否则如果将所有可能的潜在联系全部展示，会使顾客在大量的信息面前无从分辨与选择，那也就失去数据挖掘的意义了。一

　　　　　　　　　　ＣＨＩＮＡ　ＳＴＡＴＩＳＴＩＣＳ

中国统计

５３

与《数据挖掘功能之四_关联分组_戴稳胜》相关的范文

12-14 关于信息化建设情况的汇报提纲

　　根据会议通知要求，将我市信息化建设的现状、存在的问题，以及今后的发展设想作一简要汇报。一、我市信息化发展现状进入90年代后，面对全球信息化浪潮，从国家到地方对信息化建设逐渐引起高度重视，我市的信息化建设也开始从认识到起步，特别是近几年来有了较快的发展。㈠建立信息化领导机构，编制信息化发展规划。我市于96年3月成立了市信息产业化发展领导小组，以及领导小组办公室。负责组织协调全市信息化的规划 ...

04-30 通信工程认识实习报告

　　前言内容　　作为学习通信工程专业的学生，作为以后即将成为一名通信人的学生来说，了解通信基础知识，掌握通信专业的学习方法，明白通信行业最前沿的科技知识，是关系到自己前途，关系到自己人生价值能否实现的人生大事。　　通过近一周的学习，我们从感性上学到了很多东西，也对我们将来的学习和研究方向的确定产生了深远的影响。通过这次参观实习丰富了本人的理论知识，增强了本人观察能力，开阔了视野，并使我对以后的 ...

08-31 中心城区建设工作思路

服务大城建要有新作为　　市委、市政府提出“十一五”期间“建设100万人口中心城市，完善100平方公里的城市功能，培育支撑100万人口的产业”的奋斗目标，区作为市的中心城区，要在廓清思路中定向，在主动服务中定位，在属地管理中定责，为构筑百万中心城市打下良好的功能、产业和环境基础。　　更新理念，在完善百万人口城市功能设施上有所作为　　1、强化属地意识。按照全市总体规划的要求，牢固树立城市功能设施 ...

11-17 GPS测量实习报告

GPS测量实习报告一、实习目的 GPS静态测量本次GPS静态观测实习的目的是巩固、扩大和加深我们从课堂上所学理论知识，获得测量工作的初步经验和基本技能，着重培养我们的独立工作能力，进一步熟练掌握测量仪器的操作技能，提高运用理论及计算能力，并对GPS静态观测全过程有一个全面和系统的认识。熟悉GPS静态相对定位原理、Sounth、Trimble、ashtech三种GPS接收机的使用掌握GPS网的网 ...

07-27 ERP实训总结报告

ERP实训总结报告一、实训过程 1.组织准备工作组织准备工作是ERP沙盘模拟的首要环节。主要内容包括分组和职能定位。我所在A组共八名成员，分别担任cEo、营销总监、生产总监、采购与物流总监、现金会计、财务会计等主要角色。我在小组中主要负责与生产相关的工作。我们将在未来模拟经营的六年中与其他七组展开激烈竞争。 2.了解企业基本情况对企业经营者来说，接手一个企业时，需要对企业有一个基本的了解，包 ...

08-28 2014年中考化学复习计划

一、复习规划　　复习规划一般是三段式复习法。即：　　第一阶段是章节复习。按照教材编写的章节顺序，根据各章节内容划分不同的小单元进行复习。这一阶段要于4月20日左右结束，时间约8-9个周。　　第二阶段是专题复习。按照教材编写的知识体系，设计不同的知识专题，根据不同的知识专题进行复习。这一阶段要于5月20日左右结束，时间约5-6个周。　　第三阶段是模拟测试。按照中考试题格式及标准，设计中考模拟 ...

12-10 2014年建筑装饰企业上市辅导与实施方案咨询报告

【关键词】建筑装饰建筑装饰企业上市建筑装饰报告【报告简介】本报告为我公司独家首创针对企业上市融资提供前期指导服务的专项研究报告，此报告为个性化定制服务报告，我们将根据不同类型及不同行业的企业提出的具体要求，修订报告目录，并在此目录的基础上重新完善行业数据及分析内容，为企业顺利上市融资提供全程指引服务。本公司凭借多年行业研究服务和指导企业上市过程中得出的经验是：当企业发展到一定阶段就会遇到资 ...

01-23 2014年房地产开发企业上市辅导实施方案咨询及前景分析

20XX年房地产开发企业上市辅导实施方案咨询及前景分析预报告第一部分行业发展情况分析第一章中国房地产开发行业发展概述第一节房地产开发行业发展情况第二节最近3～5年中国房地产开发行业经济指标分析一、赢利性二、成长速度三、附加值的提升空间四、进入壁垒／退出机制五、风险性六、行业周期七、竞争激烈程度指标八、当前行业发展所属周期阶段的判断第三节关联产业发展第二章应用领域及行业供 ...

10-09 桃红中学"构建高效课堂"实施方案

桃红中学“构建高效课堂”实施方案一、指导思想针对目前课堂教学方法陈旧、效率不高的现状，为了充分落实学生的主体地位，激发学生自信和挖掘学生潜力，采用“自主、合作、探究”新课程理念，学习、借鉴“杜郎口教学模式”和兄弟学校课改经验，进一步深化课堂教学改革，提高教育教学质量和全面实施素质教育。根据上级主管部门文件精神，结合我校实际，特制定我校构建高效课堂实施方案。二、实施方案（一）加强领导，健全组 ...

05-19 初中生物试卷分析报告

初中生物试卷分析报告一、对试卷的总体评价今年初中生物学科期末考试试题很好地体现了“三个有利于”的命题指导思想，依据《中学课程标准》，注重从知识与技能、过程与方法、情感态度与价值观三个层面上考查学生的生物基础知识和基本技能。试题设计注重理论联系实际和学生能力的考查，注重对学生所学知识在生活实践中应用方面的考查。试题的导向有利于教师在平时的教学中实施素质教育，培养学生的创新精神和实践能力，培养学生 ...

随机推荐

猜你喜欢

数据挖掘功能之四_关联分组_戴稳胜

·中学2014-2014(1)七(6)班语文教学计划

·大专生毕业典礼演讲稿范文

·转帖:巴厘岛自由行分享

·四年级数学下册教师用书后期末练习1

·钢筋冷加工

·祖国发展我成长

·荐读|马云的成功真的不是偶然

·三国志英杰传NES攻略

·[一次别离]影评

·设计开发管理制度

·在小学2010年毕业典礼上讲话

·如何做电商企业文化

·[优秀作文]丰富多彩的声音世界

·让宝宝爱上吃饭的小玩意儿

·撬动人际关系的冻土层

·七年级上册数学第一单元测试卷

·市第十次党代会精神的学习宣传方案

·第一届茅盾文学奖获奖作品集[李自成]

·从"管理实践评选"看中国管理实践研究

·浅谈如何提高阅读教学中学生的迁移能力