数据挖掘技术在汽车故障诊断系统中的应用
GUANLIKEXUEYUGONGCHENGJISHU
数据挖掘技术在汽车故障诊断系统中的应用
杨婷婷 马 瑜/玉溪师范学院信息学院
【摘 要】为了及时有效的对汽车故障进行诊断,在汽车故障诊断中引入数据挖掘技术,利用属性相关的决策树算法来对数据进行分析和处理,克服原有的决策树算法在属性权值方面无法有效决策的瓶颈,进而得出有效的故障诊断结果,提高汽车故障诊断系统的准确率。
【关键词】汽车故障诊断;数据挖掘; 决策树算法
汽车行业的迅速发展,也推动着社会各行业的发展,利用汽车自身采集数据来对其科学地进行故障的识别、诊断也成为了热门话题。而其中数据的有效运用决定着汽车故障诊断系统的优劣,数据质量的保障也越来越得到人们的关注。本文基于获取的汽车运行数据,利用数据挖掘的方法,获得故障模式判定决策树,进而再对决策树算法考虑属性相关,改进传统决策树算法,弥补传统决策树算法的不足,提高决策结果的准确率,使得汽车故障数据在汽车故障诊断系统中得到高效利用。
汽车故障诊断系统,通过对用户提供的汽车数据进行判断,给出故障诊断的结果集,其中包括通过决策诊断,给出最可能导致该故障发生的原因,以及该故障可能会诱发的其它故障有哪些,给出汽车修理意见和保养意见,让车主可以自行检测汽车故障,得到解决方案。
二、决策树算法
决策树是一种直观的知识表示方法,同时也是高效的分类器。这类方法的主要思想是以信息论为工具,在各非叶节点选择测试属性,自上而下地分割训练实例集,直到满足某种终止条件,即节点中的实例属于同类。
(一)I D 3算法
ID3算法[2]是一种基于信息熵的决策树学习算法,是决策树算法的代表。ID 3算法的核心是:在决策树各级结点对属性进行选择时,用信息增益(inf o r m a t i o n g a i n )作为属性的选择标准,选择信息增益最大的属性产生决策树结点,由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树结点的分支,直到所有子集仅包含同一类别的数据为止。其优点是:算法的理论清晰,方法简单,学习能力较强。但是I D 3算法不能增量的接受新的属性权值,每增加一次都会抛弃原有的决策树,所以在开销和效率上达不到满意的效果。
(二)C 4. 5算法
C4.5算法继承了ID 3算法的全部优点,与ID 3不同,C4.5采用基于信息增益比的方法选择测试属性,在各级结点上,用信息增益率作为选择分支属性的标准,较好的处理了连续型属性或缺失数据的问题,在树剪枝技术方面也比较成熟,在精简决策树的同时把连续值属性离散化,提高了分类的准确率。
(三)属性相关的决策树算法
汽车故障诊断系统采用的决策树算法是传统的决策树算法与属性相关相结合的。属性相关分析依据每一维的属性相关稠密程度来对属性进行冗余删除,各维之间互不影响,所以各维的稀疏稠密性可以按属性维独立运算,因此垂直划分的并行计算能够很好的实现属性相关分析。在属性相关分析删除冗余属性过程中,主节点首先根据子节点数M 和属性数D 垂直划分(D/M)数据集P;主节点分配任务后,子节点利用属性相关分析求出每个数据子集的冗余属性。然后子节点将冗余属性序号传回主节点,由主节点合并处理后删除冗余属性,此时返回的结果集会更加准确的对现有故障进行决策判断,给出可用率更高的故障诊断结果。
一、 汽车故障诊断系统
汽车故障诊断系统是以检测技术为基础,借助故障专家系统科学地确定汽车技术状态,识别、判断故障,甚至预测故障的综合性技术。众所周知,专家系统是一种模拟人类专家解决领域问题的计算机程序系统,其包含着某个领域专家水平的知识和经验,能够运用人类专家的知识和解决问题的方法来模拟人类专家的决策过程,来解决该领域的复杂问题,而知识故障诊断[1]是专家系统中最成功的一个应用领域。汽车诊断与普通的人工检测有原则上的不同,它是在试验研究的基础上,借助科学技术的新成就,在满足整体车型不解体的条件下诊断的,具有科学、高效、省力、准确的特点。汽车诊断技术随着汽车技术的不断完善化、多功能化和自动化而发展起来的。
(一)判断依据
汽车故障诊断系统是根据获得的汽车运行数据,通过对数据进行判断和决策从而对汽车的故障进行诊断的。首先,汽车故障诊断系统对汽车故障的判断只是一个模糊的判断,也就是说,因为数据挖掘的有限性,我们不能深层次的判断出具体是汽车那个零件出现问题,只能判断出出现该汽车故障可能是因为那些部件导致的。其次,汽车故障诊断系统背后有着强大的数据库支持,利用专家系统通过人机界面回答系统的提问,推理机将用户输入的信息与知识库中各个规则的条件进行匹配,并把被匹配规则的结论存放到综合数据库中。不断地完善和从事知识库中的知识,随着数据库得到不断地完善,从而使系统的准确率和使用率越来越高。最后,该系统里的系统算法会根据系统获取的数据进行分析和决策,最终得出相应的诊断结果。系统会根据不同信息进行识别,即便是遇上暂时不能识别的信息,系统也会自动保存该信息,同时通知管理员对新信息进行查询以及给出处理方案,通过一步步完善数据库来完善该系统。
(二)判断结果
比较不同月度的 平均检修时间,可以为当月的检修工作提供一个参考性评价。
将月度平均检修时间再按设备类型分类统计,比较同类设备不同月度的平均检修时间,可以对当月的某类设备检修工作提供一个参考性评价。
(三)人员分析
人员分析主要是通过关于工作负责人的检修记录统计分析,可以得到某人对某变电站、对某类设备、对某种故障原因的检修工作具有较多处理经验的信息。为今后大型和重要的检修工作,工作负责人的安排提供参考依据。
(四)检修运作成本分析
检修运作成本分析是通过对变电站油耗和工作成员的工作餐消费统计分析,可以得到某月的检修运作成本。通过对每月的检修运作
成本的均值,方差及方差系数计算,可以为检修工作的运作费用计划提供依据。
四、 展望
通过统计数据的分析对设备故障进行预测并合理安排检修,提高电力设备运行的稳定、经济和安全性,是现代社会对企业的高效要求。
【参考资料】
[1]李祥明.浅谈电力系统变压器状态检修管理分析[J] .科技与企业,2011,(12):100
[2]李朋.Excel统计分析实例精讲[M].北京科海电子出版社,2006
[3].李志武.电力设备状态检修实施策略研究[J].忻州师范学院学报,,2009,10(8):779-782
250
鹤煤五矿32°大倾角带式输送机的研制与应用
郭志坚 张广垒 李 宾/河南煤化鹤煤公司第五矿,河南 鹤壁 458000
一、 箕斗轨道绞车提升系统概况
箕斗轨道属暗斜井,轨道绞车最初于1979年安装,由洛阳矿山机械厂制造,绞车型号为XKT2×2.5×1.2E 型,2006年2月份更换成了液压防爆绞车,滚筒直径为φ2.5m,滚筒数目2个,滚筒宽度1.2m。箕斗轨道平均坡度为32°,提升距离406m,提升高度为224m ,采用双码箕斗提升,一次提煤量为4t ,年设计提升能力为45万吨。但我矿主井绞车年设计提升能力为60万吨,箕斗轨道液压绞车提升能力不能与主井绞车提升能力相匹配。
鹤煤五矿原来使用液压防爆绞车采用箕斗将原煤从二水平提升到一水平,但该绞车经常出现液压元件易损坏、管路漏油、噪音超标、故障率高等现象,且提升能力小,不能与主井提升能力相匹配,直接制约着五矿原煤运输。为了彻底解决箕斗轨道绞车提升能力不能满足矿井生产需要的瓶颈难题,经过认真调查、研究和论证,结合五矿现场实际情况,大胆创新,通过改造轨道和采取一系列措施,决定使用大倾角上运带式输送机来代替绞车牵引箕斗提煤任务,成功解决了我矿原煤运输难题,为矿井以后类似条件下上运带式输送机的安装和使用提供了宝贵经验。
二、大倾角带式输送机设备配置
根据带式输送机设备配置依据的标准与规定,通过计算
,得出以下大倾角带式输送机设备配置方案作者简介:郭志坚,男,(1973-)从事矿井生产20多年,(略)
鹤煤五矿职工。
三、诊断系统中的数据运用
汽车故障诊断系统是通过汽车自身提供的数据信息对故障原因进行判断的,所以在数据的分析和处理上能够很好的保证数据的正确性,将会提高系统的整体效率。例如:文献[3]提出的有关方法通过数据实例和数据源模式自动发现属性之间的关联规则、分类规则、相关关系、数据之间的相似性等,用于检测、纠正异常或不一致的数据,为消除多数据源之间的数据冲突、明确属性含义提供依据。在数据库中存在着一些异常数据,这些数据往往会影响到数据分析的结果,根据不同属性对决策影响程度的不同进行加权,以提高决策结论准确性,,可以高效的避免产生误差较大的结果集。
汽车故障诊断系统中的决策树采用了属性相关的决策方法,在属性的选取上进行了改进,利用引入属性优先关联度参数计算节点的修正信息增益,并选择具有最高修正增益的属性作为当前节点的测试属性。在提高分类准确率的同时,有效地增强了模型的健壮性。 (一)故障诊断中的数据读取
在进行汽车故障诊断的过程中,首先按照通常故障的排除规律,根据汽车出现的故障现象一步步进行分析,确定可能产生故障的部件,即检查各类机械结构部件的工作状况,如电动油泵的供油能力、油路的压力状况,火花塞工作状况、点火线圈工作状况和气缸压力等。但本系统是给大众使用的,可能在一些汽车使用术语中,一般只有专业人士才能读懂仪表盘,或是根据经验来判断导致故障发生的部位,往往当汽车发生故障的时候,外行人士只能看到汽车的表面现象,如:柴油消耗量过大,排气管冒黑烟、冒白烟、冒蓝烟,动力转向变沉重,驾驶中水温过高,电子打火不能很好的启动等等一系列可以直观的表面现象。故障诊断系统会读取这些数据信息,根据这些故障影响因素来挖掘数据,通过数据分析,进行逐层的决策分析从而找出异常数据,判断故障出现的原因,同时根据先前调入分析的数据给出可能导致即将发生的故障。
(二)数据分类与分析
汽车故障诊断系统有着强大的后台数据库支持,数据库中的数据是由开发人员在系统开发时进行设计和录入的,先期通过开发人员的调研和分析建立好相对完善的数据库,在运用过程中汽车故障诊断系统会通过属性相关的决策树算法将使用者提供的数据进行分类,再与数据库中的信息进行一一比对,然后判断得出最终结果,若分类后与数据库信息进行比对的时候发现找不到相应的数据信息,系统将会给出提示,然后将会对陌生数据进行保存,随即系统将会提示系统管理人员发现陌生数据,由管理人员对陌生数据进行判断和处理,最后将处理的结果存放在数据库中,使数据库进一步完善,方便用户下次查找时可以得到相应的解决方法。
众所周知,汽车出现某些现象的时候,可能都是因为同一原
因。如汽车发动机功率不足可能会导致气缸气压偏低,耗油量偏低,水温过低或是水温过高。其中当出现气缸气压偏低时92%的时候是因为发动机功率不足引起的,水温超过90度的时候77%也是因为发动机功率不足引起的等等。
发动机功率不足可能会导致的故障如表1和图1所示:表1
图1因发动机功率不足可能导致的各种故障柱形图四、总结
汽车故障诊断系统的开发与设计可以给人们的生活带来很多便利,加快修理人员的工作效率,使车主在使用车辆的时候可以进行自行检测,对汽车故障防范于未然。我们以决策树分类算法为理论支撑,以故障诊断系统为技术,使用Java+Mysql设计和开发汽车故障诊断系统。把决策树分类理论应用到故障诊断系统中,充分利用故障数据,有效提高故障诊断率。故障诊断方式的多元化、学习的自动化,以及多种智能技术的结合是当前故障诊断系统的总趋势,对该汽车故障诊断系统有必要再进一步完善,使得故障诊断系统能够得到广泛应用。
【参考文献】
[1] 陈永光,李修和.沈阳组网雷达作战能力分析与评估[M].国防工业出版社,2006
[2]栾丽华,吉根林.决策树分类计数研究[J].计算机工程,2004,30(9):94-95
[3] Chiang F, Miller R J. Discovering data quality rules[C]∥Proc. of the International Conference on VeryLarge Data Bases, 2008:1166-1177.