贝叶斯网络结构学习及其应用研究_黄解军

09-25

第29卷第4期2004年4月武汉大学学报#信息科学版

Geomatics and Information Science of Wuhan U niversity V ol. 29No. 4Apr. 2004

文章编号:1671-8860(2004) 04-0315-04文献标识码:A

贝叶斯网络结构学习及其应用研究

黄解军万幼川潘和平

(1 武汉大学遥感信息工程学院, 武汉市珞喻路129号, 430079)

摘要:阐述了贝叶斯网络结构学习的内容与方法, 提出一种基于条件独立性(CI) 测试的启发式算法。从完全潜在图出发, 融入专家知识和先验常识, 有效地减少网络结构的搜索空间, 通过变量之间的CI 测试, 将全连接无向图修剪成最优的潜在图, 近似于有向无环图的无向版。通过汽车故障诊断实例, 验证了该算法的可行性与有效性。

关键词:贝叶斯网络; 结构学习; 条件独立性; 概率推理; 图论中图法分类号:T P18; T P311

贝叶斯网络学习是贝叶斯网络的重要研究内容, 也是贝叶斯网络构建中的关键环节, 大体分为结构学习和参数学习两个部分。由于网络结构的空间分布随着变量的数目和每个变量的状态数量呈指数级增长, 因此, 结构学习是一个NP 难题。为了克服在构建网络结构中计算和搜索的复杂性, 许多学者进行了大量的探索性工作[1~5]。至今虽然出现了许多成熟的学习算法, 但由于网络结构空间的不连续性、结构搜索和参数学习的复杂性、数据的不完备性等特点, 每种算法都存在一定的局限性。本文提出了一种新算法, 不仅可以有效地减少网络结构的搜索空间, 提高结构学习的效率, 而且可避免收敛到次优网络模型的问题。

述, 在具体问题领域, 内部的变量关系形成相对稳定的结构和状态。这种结构的固有属性确保了结构学习的可行性, 也为结构学习提供了基本思路。贝叶斯网络结构学习是一个网络优化的过程, 其目标是寻找一种最简约的网络结构来表达数据集中变量之间的关系。对于一个给定问题, 学习贝叶斯网络结构首先要定义变量及其构成, 确定变量所有可能存在的状态或权植。同时, 要考虑先验知识的融合、评估函数的选择和不完备数据的影响等因素。

1. 2 贝叶斯网络结构学习的方法

近10年来, 贝叶斯网络的学习理论和应用取得了较大的进展。目前, 贝叶斯网络结构学习的方法通常分为两大类:¹基于搜索与评分的方法, 运用评分函数对网络模型进行评价。通常是给定一个初始结构(或空结构) , 逐步增加或删减连接边, 改进网络模型, 从而搜索和选择出一个与样本数据拟合得最好的结构。根据不同的评分准则, 学习算法可分为基于贝叶斯方法的算法[3, 7]、基于最大熵的算法[8]和基于最小描述长度的算法[1, 2]。º基于依赖关系分析的方法, 节点之间依赖关系的判断通过条件独立性(CI ) 测试来实现, 文献[9, 10]描述的算法属于该类算法。前者在DAG 复杂的情况下, 学习效率更高, 但不能得到一个最优的模型; 后者在数据集的概率分布与DAG 同构的条件下, 通常获得近似最优的模型[11],

1 贝叶斯网络结构学习的基本理论

1. 1 贝叶斯网络结构学习的内容

贝叶斯网络又称为信念网络、概率网络或因果网络。它主要由两部分构成:¹有向无环图(directed acyclic graph, DAG) , 即网络结构, 包括节点集和节点之间的有向边, 每个节点代表一个变量, 有向边代表变量之间的依赖关系; º反映变量之间关联性的局部概率分布集, 即概率参数, 通常称为条件概率表(conditional probability table, CPT) , 概率值表示变量之间的关联强度或置信度。贝叶斯网络结构是对变量之间的关系描

收稿日期:2004-01-23。

项目来源:国家自然科学基金资助项目(60175022) 。

[6]

316武汉大学学报#信息科学版2004年

但运用该方法要求样本数据集具有一定的规模。同样, 条件互信息I (X , Y |Z) 定义为:

I (X , Y |Z) =

X, Y, Z

2 贝叶斯网络结构学习的启发式算

法

2. 1 算法的原理

贝叶斯网络结构学习是通过对给定数据集的学习和训练, 寻找一种最佳的网络来表达变量之间的依赖关系, 即确定变量之间的因果连接集合。本文提出一种贝叶斯网络结构学习的启发式算法, 其基本思路是基于给定数据集, 通过CI 测试, 有效地修剪完全潜在图, 得到一个最优的无向结构或最小潜在图。在给定其他变量子集的情况下, 任何两个变量X 和Y 之间的条件独立性可以通过概率表中的边缘概率和条件概率来判断, 而概率表由给定的数据集直接计算得出。

定义1 如果给定某一问题领域的各个变量, 用一个节点表示其中的一个变量, 由任意两个节点之间的无向边连接构成的图模型, 称为完全潜在图(potential graph, PG) 。

定义2 如果变量X 、Y 和变量集Z 之间存在以下关系:P (X |Z ) =P (X |Y , Z) , 即在变量集Z 已知的条件下, 变量Y 的状态和概率不会造成对变量X 的影响, 称为在给定变量集Z 的前提下, X 条件独立于Y, 记为I (X L Y |Z ) 。

定义3 设X 、Y 和Z 为有向无环图中3个互不相交的节点子集, 如果从X 中一个节点到Y 中一个节点的所有路径之间, 存在节点W 满足下列条件之一:¹W 具有收敛箭头, 且W 或任何W 的子节点不包含在Z 中; ºW 没有收敛箭头, 而且W 存在于节点集Z 中。则称在给定条件集Z 的情况下, X 与Y 为d -分割, 记为D 。

定理1 对网络结构中的节点集X 、Y 和Z, 当且仅当P (X |Y , Z ) =P (X |Z ) 时,

D 成立。

E p (X , Y, Z) #

(2)

p (X |Z) p (Y |Z)

先假设所有的节点之间存在连接, 节点X 和Y 之间连接的潜在性运用条件互信息来计算。在通常情况下, 设定一个较小正实数的阈值E , 当I (X , Y |Z) [E 时, 称X 与Y 被条件集Z 进行d -分割, 即在给定Z 的条件下, X 条件独立于Y, 从而删除X 与Y 之间的连接。经过n (n -1) /2次CI 测试, 最后由完全潜在图修剪成稀疏的理想潜在图。2. 2 算法实现

1) 初始化完全潜在图。

根据给定的具体问题和数据实例, 建立全连接图, 即假设任意两个变量之间都存在依赖关系, 用连接边表示变量之间的关联性, 则可构成完全潜在图。数学模型表示为:

PG =(V, L, 5)

式中,

V ={V 1, V 2, , , V n }L ={(V i -V j ) |V i , V j I 连接边L 的数量为:

|L |=n (n -1) /2

与变量X 相邻的变量数, 初始化有:

A X =V \{X }因此, |A X |=n -1, 其中n =|V |。

2) 融合先验知识。

对于网络中任意两个变量X 和Y, 根据专家知识或先验常识, 设定:

(1) L 0={(X , Y ) }, 表示变量对(X , Y ) 之间存在无向连接的集合;

(2) L 1={(X , Y ) }, 表示变量对(X , Y ) 之间不存在无向连接的集合;

(3) T p 表示初始贝叶斯网络中任意变量的最大父节点数, 可以通过专家知识或先验常识设定一个整数T p

3) 潜在图修剪。

输入完全潜在图, 通过CI 测试, 若CI 测试为真值, 用符号(X L Y |Z) 表示, 变量集Z 的节点数用t p 表示。设C (X , Y ) 表示变量X 和Y 的最小d -分割集, 其算法如下。

(7)

设A X 表示变量X 的直接邻近集, |A X |表示

(8)

V }

5={

(4) (5) (6) (3)

定理2[11] 在依赖模型M 中, 设X 、Y 和Z 为互不相交的子集, 条件独立性(X L Y |Z ) 满足

对称性、分解律和交换律等属性。

定理3[11] 满足对称性、分布律和交换律的依赖模型M, 从完整图中删除任意条件独立性成立的连接(X , Y) , 则产生一个惟一的最小I -map 。

根据信息论, 两个离散随机变量(对应于节点) 的X 和Y 具有联合概率函数p (X , Y) 和边缘概率函数p (X ) 、p (Y), 其平均互信息I (X , Y) 定义为:

I (X , Y) =E p (X , Y) lg (1)

p (X ) () Y

第4期黄解军等:贝叶斯网络结构学习及其应用研究317

for (t p =0; t p

let X =V i , Y =V j , U =V \{X , Y}if((X , Y ) I L 0) , then

set (X , Y) =t p , |A Y |>t p 设Z =(A X G A Y ) \{X , Y}, 计算条件互信息I (X , Y |Z) //结合联合概率表及式(1) 、式(2) 计算if I (X , Y |Z ) [E 即(X L Y |Z ) 成立then 删除X 和Y 之间的连接A X =A X \{Y}, A Y =A

X 与Y 条件独立, 即X 与Y 之间的连接边不存在。在该实例中, 取置信度为95%, 当|Z |=0时, 计算互信息I (X , Y ) , 可删除连接边(1, 2) 、(1, 3) 、(1, 6) ; 同样, 当|Z |=1和|Z |=2的情况下, 根据条件互信息I (X , Y |Z ) , 进行V 2检验, 可删除(1, 8) 、(3, 5) 、(4, 7) 、(7, 8) 等连接边, 结果可得到最小潜在图(图2的无向版) 。运用因果发现算法并结合先验知识, 确定节点之间连接的方向, 构成汽车故障诊断网络, 从而为汽车故障的诊断与维护提供科学依据。

\{X }

图1 汽车故障诊断的完全潜在图

F ig. 1 Fully P G of A utomobile Diag nost ic N etwork

设d -分割集C (X , Y) =Z else set

在以上算法中, 从完全潜在图开始, 由于完全潜在图包含n (n -1) /2条边, 需要n (n -1) /2次CI 测试, 对连接边进行修剪。但是, 先验知识和专家知识的融入可以有效地减少CI 测试, 特别是在网络结构稀疏的情况下, 效果更加明显。由定理2和定理3可知, 算法获得的网络结构为数据集的最小I -map , 但要求样本数据达到一定的规模, 才能保证网络模型的准确性。同时, 算法的效率取决于数据集包含的属性个数和样本规模。

图2 汽车故障诊断的网络模型

F ig. 2 M odel of Automobile Diagnostic N etw ork

该方法不仅可以减少计算的复杂度, 还可以综

3 实例分析

以汽车故障诊断为例, 采用10000个样本记录的数据集, 该领域问题用8个变量及其状态表示为:¹油压(正常、低、无) ; º风扇带(紧、松、断裂) ; »电池(满、弱、失效) ; ¼温度(正常、高、极高) ; ½系统正常(是、否) ; ¾汽车边灯(正常、熄灭) ; ¿汽车前灯(正常、熄灭) ; À引擎器(正常运行、停止运行) 。先根据变量定义, 将8个变量分别用8个节点表示, 建立任意两个节点之间的连接, 构成完全潜在图(见图1) 。基于样本数据, 计算相关的概率参数, 构成联合概率表, 通过边缘概率和条件概率计算条件互信息I (X , Y |Z) 。在给定置信度的基础上, 可运用V 2检验来判断条件独立性[12]。若计算值I

(, Z V 2/n , Z 合考虑样本数据和专家知识, 具有因果分析、关联

分析和时序分析等功能, 可应用在故障诊断、分类聚类、可靠性评估等领域。但要求数据集包含的变量为离散变量, 若出现连续变量, 则需要对数据进行预处理, 即离散化; 样本数据必须是完备的数据集, 样本规模足够大, 且样本数据量越大, 得到的网络结构越好, 但样本规模将影响到计算效率。

4 结语

本文算法从完全潜在图出发, 利用专家知识和先验常识, 设定相关参数, 有效地减少网络结构的搜索空间。通过CI 测试, 确定变量之间的依赖性, 将全连接无向图修剪成最优的潜在图, 近似于有向无环图的无向版。实例证明了该算法的可行,

318武汉大学学报#信息科学版

2004年

的情况, 该算法的有效性还有待于进一步验证。同时, 算法对样本规模的灵敏度以及对不完备性数据的学习也是今后研究的内容。

参考文献

1 Bouckaer t R R. Belief Networks Construction U sing the

M inimum Descriptio n Leng th Principle. L ectur e Notes in Computer Science, 1993, 747:41~482

Lam W,

Bacchus F.

L earning Bayesian Belief

N etw orks:A n Approach Based on the M DL Principle. Computational Intelligence, 1994(10) :269~2933 Cooper G, Herskovits E. A Bayesian M ethod fo r the

Induction of Bayesian N etw orks from Data. M achine L earning, 1992(9) :309~3474

Sing h M , Efficient 5

Valtor ta M.

Construction of Bayesian

Journal

N etw ork Str uctures from Data:A Brief Survey and an

Algorithm.

International

Approx imate Reasoning , 1995(12) :111~131Chickering D M.

Learning Equiv alence Classes of

Journal of M achine

Bayesian Network Structur es.

Journal of Patter n Recognition and Artificial Intellig ence, 2000, 14(7) :941~962

Geig er D,

Chickering D.

Learning

7 Heckerman D,

Bayesian Netwo rks:T he Combination of K no wledge and Stat istical Data. M achine L earning, 1995, 20(2) :197~243

8 Herskov its E. Computer -based Pr obabilistic Netwo rks Co nstruct ion:[Ph. D Disser tatio n]. Califor nia:Stanford U niversity , 1991

9 Spirtes P , Glymour C, Scheines R. An Algo rithm for Fast Recovery of Sparse Causal Graphs. Social Science Co mputer Review, 1991(9) :62~72

10 Cheng J, Bell D A, L iu W. An A lgorithm for Bayesian

Belief N etwork Construction from Data. A I &ST AT . 97, Flor ida, 1997

11 Pearl J. Probabilistic Reasoning in Intelligent System:

Networks of Prausible Inference. M or gan K aufman, 1988

12 Lui s M , de Campos, Huete J. A New Approach for

L ear ning Belief N etw orks Using Independence Criteria. International Jour nal of A ppr oximate Reasoning, 2000, 24(1) :11~37

第一作者简介:黄解军, 博士生。研究方向为数据挖掘与数据仓库等。

E -mai l:hjjtk@21cn. com

San Fr ansisco:

L earning Research, 2002(2) :445~498

6 Pan H P, L iu L. F uzzy Bayesian N etw orks ) a Gener al

For mali sm for Representatio n,

Infer ence and Learn -I nternat ional

ing with Hybrid Bayesian Networ ks.

Bayesian Network S tructure Learning and Its Applications

H UANG Jiej un 1 WAN Youchuan 1 PAN H eping 1

(1 School of Remote S ensing an d Information Engineering, Wuhan University,

129Luoyu Road, Wuhan 430079, China)

Abstract:This paper discusses the purposes and methods of Bayesian netw ork structure learning ,

then proposes a new algorithm for this task. Based on a fully connected potential g raph, w e enter the ex pert know ledge and prior knowledge in order to reduce the query space of the structures. By using CI (conditional independence) tests, it can be pruned a fully connected potential graph to a best PG, w hich is expected to approximate the undirected version of the underly ing directed g raph. The experimental results of fault diagnosis in automobile are provided to illustrate the feasibility and efficiency of the new algorithm.

Key words:Bayesian netw ork; structure learning; conditional independence; probabilistic reasoning ; g raph theory

About the first author:HUA NG Jiejun , Ph . D candidate, m ajors in data mining and data warehou se. E -m ail:hjjtk @21cn. com

(责任编辑: 晓平)

与《贝叶斯网络结构学习及其应用研究_黄解军》相关的范文

08-11 中学现代教育技术工作总结

推进数字化校园建设，构建信息化教学模式 -ＡＡ市XX中学现代教育技术工作总结　　我校自五十年代初创办，一九五八年正式被ＡＡ县命名XX中学以来，一直是一所农村普通中学，由于方方面面的原因，学校占地一直没有多大的扩展，至今仅有二万八千多平方米，学校建筑面积也不大，仅有一万六千多平方米，且各幢建筑都较陈旧，缺少现代化的气息，在这种办学条件普通、硬件不过“硬”的情况下，我们觉得，要使学校更好地适应现代社 ...

10-23 课题论证

1.选题：本课题国内外研究现状述评，选题的意义。2.内容：本课题研究的基本思路和方法，主要观点。3.预期价值：本课题理论创新程度和实际应用价值。 4.研究基础：近年已有相关成果：主要参考文献（两类限填20项）。（请按此4部分逐项填写，限20xx字内）。一、本课题国内外研究现状述评，选题的意义国外远程教育的发展，始于十九世纪后期的美国，最早依赖于印刷媒体，二十世纪二十年代无线电技术开始被应用到函 ...

10-16 学校电化教育学期工作总结

　　本学期,在学校的正确领导下,在全校教师的积极配合下,我校的电教工作取得了一定的成绩,学校网络运行稳定,开通了学校网站,并取得了威海市网站评选一等奖,课题研究工作成绩辉煌,取得了4个一等奖的佳绩,在本月课题将进行结题。毕洪泉老师指导的学生作品获省一等奖，宣启文老师指导的电脑绘画获市一等奖，各项工作都走在了全市的前列：一、网络管理目前我校的网络已投入正式运行，共有200余台机器上网，网络成了我们工 ...

06-20 现代远程教育应用先进个人典型事迹

现代远程教育应用先进个人典型事迹　　本人生于1982年9月，汉语言文学教育本科毕业，20XX年9月参加教育教学工作。曾担任过小学语文、数学、信息技术等科目的教学。在十年的教学生涯中，我始终忠诚党的教育事业，时常以一个优秀教师的标准严格要求自己，师德高尚，爱岗敬业，勤奋努力，对本职工作精益求精。工作认真负责，有责任心，积极主动，能吃苦耐劳，敢于创新，敢于迎接挑战，敢于承担责任；善富有工作激情，乐业 ...

01-31 远程教育工程建设及资源应用汇报材料

远程教育工程建设及资源应用汇报材料一、学校基本情况平定县巨城中学坐落在巨城镇河东村,现有教学班18个，学生721人,总建筑面积4408平方米，总占地面积10581平方米。巨城中学现有教职工48人，专任教师45人,其中本科28人，中学高级教师2人，中学一级教师6人,在职教师学历达标率97.8%。巨城中学是一所有着优良传统的学校，多年来学校全面贯彻党的教育方针，全面提高教育教学质量，为社会主义建 ...

01-23 审计局信息化建设"十二五"规划

审计局信息化建设“十二五”规划 “十二五”时期是我国深入贯彻科学发展观，全面建设小康社会、积极构建和谐社会的关键时期，也是审计机关大力推广先进审计技术方法，积极探索信息化环境下新的审计方式，促进提高审计工作效率和质量的重要战略机遇期。为切实做好审计信息化发展“十二五”规划的编制工作，保障审计信息化建设在“十二五”期间实现又好又快发展，结合我市经济社会和审计工作的新形势和新要求，市审计局在认真总结 ...

03-21 辅修专业教学计划

《工程管理》辅修专业教学计划一、专业培养目标本辅修专业的培养目标设定为培养德、智、体、美全面发展，具备土木工程技术与工程管理相关的管理、经济与法律等方面基本知识，掌握工程管理的基本理论、方法和手段,获得工程师和经济师的基本训练，具有一定实践能力和创新能力，能在建设工程总承包公司、工程施工单位、工程咨询中介机构等从事一线工作的应用型高级专业人才。二、专业培养要求本辅修专业的学生通过学习可获得 ...

12-29 登山行动重大项目申报材料

　　为了进一步加强本市的基础研究工作，提升*科技持续创新能力和国际学术地位，围绕国家和*市中长期科技发展规划和“登山行动计划”的要求和重点任务，针对生命科学、信息科学、材料科学等领域的前沿科学问题。开展以应用为导向的创新研究，特发布本指南。　　一、研究专题和期限　　专题一、成形制造中材料微观结构与应力场控制的研究　　研究目标、内容　　成形制造过程中的材料微观结构与应力场的控制是高精度、高性 ...

12-01 高中2014年度上学期远程教育工作计划

高中20xx至20xx学年度上学期远程教育工作计划为充分发挥现代远程教育资源优势，使其更好地服务于教育教学工作，促进课堂效率和教学质量不断提高，更好地发挥远程教育的效益，特制定本计划。一、指导思想以科学规范的管理，通过制度创新、搭建平台、整合资源等策略，提高远程教育资源应用水平，积极将远程教育课程资源作为学校教育改革，推进素质教育，实施质量提升的突破口，积极树立以质量为中心的应用理念，不断加 ...

12-04 "现代教育资源管理应用年"活动实施方案

“现代教育资源管理应用年”活动实施方案为认真贯彻国家关于促进教育均衡发展的有关精神，切实做好我县中小学教育资源的管理和应用工作，巩固提高我县教育硬件建设成果，充分发挥现有资源的作用，不断提高我县教育教学质量，经研究决定，20XX年在全县范围内开展“现代教育资源管理应用年”活动。为确保活动顺利开展，特制定本方案。一、指导思想认真贯彻落实全国人大十一届三次会议及省、市有关会议精神，以科学发展观为 ...

随机推荐

猜你喜欢

贝叶斯网络结构学习及其应用研究_黄解军

·市文化局八项措施开展"做党的忠诚卫士,当群众的贴心人"活动

·耕耘在春天的沃野(小学教师事迹)

·市委书记在区县委书记谈心会上的讲话

·XX乡XX年科技工作总结

·[优秀作文]在我人生的储蓄罐里

·土石方开挖施工方案

·数字资源管理使用制度

·当今时代的教育主题

·浅谈高等数学在经济学中的应用

·批评与自我批评心得体会

·社保局三八妇女节座谈会的主持词

·中学七年级英语顶岗实习报告

·珍爱生命国旗下讲话

·男护士的现状分析

·软件项目需求说明书(模板)

·善待动物就是善待我们自己

·2013.1房产公司启动会主持稿

·导游带团:导游带团心得体会一

·提高小学生阅读理解能力的方法

·2015年银行安全教育心得体会