数据挖掘功能及各自方法总结

02-09

数据挖掘功能的特点及主要挖掘方法

一、数据挖掘功能的特点及主要挖掘方法

数据挖掘的目标是从数据库中发现隐含的、有意义的知识，主要有以下几类功能：

(1)概念描述

概念描述又称数据总结，其目的是对数据进行浓缩，给出它的综合描述，或者将它与其它对象进行对比。通过对数据的总结，可以实现对数据的总体把握。最简单的概念描述就是利用统计学中的传统方法，计算出数据库中各个数据项的总和、均值、方差等，或者利用OLAP(0n Line Processing ，联机分析处理技术) 实现数据的多维查询和计算，或者绘制直方图、折线图等统计图形。

(2)关联分析

关联分析就是从大量数据中发现项集之间有趣的关联或相关联系。随着大量数据不停地收集和存储，许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事务记录中发现有趣的关联关系，可以帮助许多商务决策的制定。

关联分析的主要方法有Apriori 算法、AprioriTid 算法、FP-growth 算法等。

(3)分类和预测

分类和预测是两种数据分析形式，可以用于提取描述重要数据类的模型或预测数据未来的趋势。就是研究已分类资料的特征，分析对象属性，据此建立一个分类函数或分类模型，然后运用该模型计算总结出的数据特征，将其他未经分类或新的数据分派到不同的组中。计算结果通常简化为几个离散值，常用来对资料作筛选工作。分类和预测的应用十分广泛，例如，可以建立一个分类模型，对银行的贷款客户进行分类，以降低贷款的风险；也可以通过建立分类模型，对工厂的机器运转情况进行分类，用来预测机器故障的发生。

分类的主要方法有ID3算法、C4.5算法、SLIQ 算法、SPRINT 算法、RainForest 算法、Bayes 分类算法、CBA(Classification Based on Association) 算法、MIND(Mining in Database)算法、神经网络方法、粗糙集理论方法、遗传算法等。

(4)聚类分析

当要分析的数据缺乏描述信息，或是无法组成任何分类模式时就采用聚类的方法，将异质母体区隔为较具同构性的群（Cluster) ，即将组之间的差异识别出来，并对个别组内的相似样本进行挑选，实现同组数据相近，不同组数据相异。分类功能和聚类功能是不同的，分类是根据预先定好的一些特征值对对象分组，组或类是预先确定好的，而聚类是事先不知道的条件下根据对象的一些相似特征分组。聚类也便于将观察到的内容组织成分层结构，把类似的事件组织在一起。

聚类分析的主要方法有划分方法、层次方法、基于网格的方法、统计学和神经网络方面的方法。

(5)孤立点分析

数据库中可能包含一些数据对象，它们与数据的一般行为或模式不一致。这些数据对象就是孤立点。许多数据挖掘算法试图使孤立点的影响最小化，或者排除它们。但在一些应用中孤立点本身可能是非常重要的信息。例如在欺诈探测中，孤立点可能预示着欺诈行为。

(6)时间序列分析

在时间序列分析中，数据的属性值是随着时间不断变化的。这些数据一般在相等的时间间隔内取得，但是也可以在不相等的时间间隔内取得。通过时间序列图可以将时间序列数据可视化。时间序列分析目前有三个基本功能：一是模式挖掘，即通过分析时间序列的历史形态来研究事务的行为特征；二是趋势分析，即利用历史时间序列预测数据的未来数值；三是相似性搜索，即使用距离度量来确定不同时间序列的相似性。

二、数据挖掘的综合应用

数据挖掘在网络入侵检测系统中的应用：

利用数据挖掘技术对审计数据加以分析，总结出一些正常模式，用来进行异常检测，将有助于提高入侵检测系统的检测准确性和完备性。在此实例中用到了聚类分析方法在非监督式异常检测中的应用，使用K 均值算法通过一系列的实验证实了这种算法可以在大量的混合数据中提取出正常数据，并能够利用得到聚类中心进行异常检测；此实例中还用到了关联规则挖掘与频繁情节挖掘技术。

单纯采用布尔型的关联规则挖掘算法〔Apriori) 可以挖掘出单条连接记录各

属性之间的相关性，得出的规则对于高密度的简单攻击具有较好的检测结果，但对于由多个行为构成的高级攻击，则检测效果不够理想。频繁情节算法挖掘的是连接记录之间的序列关系，相对于布尔型关联规则挖掘算法而言检测效果较好。

由此可见每种数据挖掘的方法都有其侧重点，对于现实的数据挖掘处理，不大可能使用单一的数据挖掘方法就能得到满意的结果，而要综合应用多种方法取各种方法之长补其之短，对数据进行挖掘才能得到满意的结果。

与《数据挖掘功能及各自方法总结》相关的范文

02-19 有关毕业设计工作要求

一、毕业设计的目的 ·总结：对在学期间所学知识的检验与总结 ·培养：培养和提高独立分析问题和解决问题的能力 ·训练：使学生受到科学研究、工程设计和撰写技术报告的基本训练二、毕业设计的选题要求 ·究结合生产、科研及技术设备的革新、改造等 ·先进性 ·实用性三、题目类型及基本要求 ·论证性题目论文意义论点论据具体论证结论及应用 ·设计性题目设计内容设计依据具体设计方案及设计步骤设 ...

04-05 计算机实习报告范文

[实习目的] 通过理论联系实际，巩固所学的知识，提高处理实际问题的能力，了解设计专题的主要内容，为毕业设计的顺利进行做好充分的准备，并为自己能顺利与社会环境接轨做准备。 [实习任务] 对计算机在人事管理方面的应用进行归纳总结,并查阅资料为毕业设计作准备. [实习内容] 计算机在人事管理中的应用随着社会的发展，科技的进步，作为信息载体的计算机日益显露出其举足轻重的地位。当今社会已步入了信息社会，知 ...

06-24 计算机人事管理工作实习报告

　　实习目的　　通过理论联系实际，巩固所学的知识，提高处理实际问题的能力，了解设计专题的主要内容，为毕业设计的顺利进行做好充分的准备，并为自己能顺利与社会环境接轨做准备。　　实习任务　　对计算机在人事管理方面的应用进行归纳总结，并查阅资料为毕业设计作准备。　　实习内容　　计算机在人事管理中的应用　　随着社会的发展，科技的进步，作为信息载体的计算机日益显露出其举足轻重的地位。当今社会已步 ...

06-01 电子信息专业实习报告

　　一.实习目的：　　生产实习是电子信息工程专业学生不可缺少的实践环节，本次实习是在学生学完所有基础课及技术基础课和大部分专业课后进行。实习的目的在于通过在网络和通信公司、企业广域网和内联网(Internet/Intranet)或实习基地的生产实践，使学生能将所学的理论和实践相结合，巩固消化所学的知识，培养实践操作技能，建立网络、信息系统集成概念，并为后继课教学及毕业环节打下基础。　　二.实习 ...

11-17 GPS测量实习报告

GPS测量实习报告一、实习目的 GPS静态测量本次GPS静态观测实习的目的是巩固、扩大和加深我们从课堂上所学理论知识，获得测量工作的初步经验和基本技能，着重培养我们的独立工作能力，进一步熟练掌握测量仪器的操作技能，提高运用理论及计算能力，并对GPS静态观测全过程有一个全面和系统的认识。熟悉GPS静态相对定位原理、Sounth、Trimble、ashtech三种GPS接收机的使用掌握GPS网的网 ...

11-12 控制测量实习报告

控制测量实习报告一．实习目的熟练掌握四等水准测量的观测方法及记录方式。练习使用用于二等水准测量的电子精密水准仪的操作方法及其电脑软件的解算方法、光学精密水准仪的的操作方法及其解算方法。掌握导线测量的测量步骤、仪器使用的方法。熟练掌握四等水准测量、二等水准测量及导线测量的操作方法并能够对测量工作有总体的认识，对城市测量规范有基本的了解。 1.1实习安排小组成员：周涛、李佳、姜日山、李宁、李宏达 ...

08-07 集团公司2014年HSE体系管理工作计划

集团公司2014年HSE体系管理工作计划一、总体思路坚持以风险管控为核心，以落实一岗双责为关键，以强化HSE审核为抓手，着力推动企业真信真学真用先进理念和方法工具，强化基层员工安全生产教育培训，推进HSE信息系统功能提升与深化应用，开展安全环保工作合规性评价，努力推动严格监管向自主管理安全文化转型升级。二、关键指标 1.组织完成一年两次的HSE审核工作； 2.所有企事业单位编制完成“一岗双责 ...

04-18 计算机科学与技术专业(本科)毕业设计(论文)要求

（一）教学目标　　毕业设计是完成教学计划达到本科生培养目标的重要环节，是教学计划中综合性最强的实践教学环节，它对培养学生的思想、工作作风及实际能力、提高毕业生全面素质具有很重要的意义。　　毕业设计的教学目标应使学生在以下几方面的能力得到训练和提高：　　1．综合运用所学专业知识分析、解决实际问题的能力；　　2．掌握文献检索、资料查询的基本方法以及获取新知识的能力；　　3．计算机软件、硬件或 ...

11-05 国税局2014年工作计划

国税局20XX年工作计划一、强化增收措施，积极组织税收收入 1、认真落实组织收入原则。继续坚持依法征税、应收尽收、坚决不收过头税、坚决防止和制止越权减免税的组织收入原则，坚决杜绝寅吃卯粮收过头税、转引税款等行为。大力清缴陈欠，严格控制新欠，坚决防止和制止以各种名义拖欠税款。科学分析税收政策调整对经济税收的影响，及时向地方党委政府汇报，充分发挥税收调控经济的职能作用。 2、加强税收经济分析。及时 ...

08-25 隧道施工与维护实训报告

隧道施工与维护实训报告一、实训目的二、隧道监控量测施工方案一．编制依据 1.施工图 2.标段指导性施工组织设计； 3.交通部颁发的规范、规程、标准： 4.高速公路建设指挥部有关要求。二．编制原则 1．高效、适用原则本方案的高效运行，能确保预报质量并有效的指导施工，适合本工程所有隧道 2．安全原则本方案的操作实施要安全，并能指导安全施工； 3．符合本单位技术水平的原则本方案拟投入的设备 ...

随机推荐

猜你喜欢

数据挖掘功能及各自方法总结

·市府机关党委书记述职述廉报告

·行政部经理助理岗位职责

·广告策划书的一般模式

·2010年第二学期学生会组织部工作计划

·测量学实习报告

·退伍军人纪念活动方案

·高考前夕班主任在高三家长会上的发言稿

·手持示波器使用手册

·胡振东笑掉大牙的幽默小段集锦:最新录制的快板书创新技巧展

·七年级数学试题14

·迎新年答谢客户酒会致辞

·销售员实习心得体会

·远程网络学习心得

·苏教版五年级数学下册教学计划

·合作建房协议书范本

·镇在全县工业经济大会上的发言

·环境保护课概论

·十八打报告(全文)

·升旗仪式献词稿

·课题计划之2:课题研究方案