BP神经网络的基本原理

05-14

5.4 BP 神经网络的基本原理BP（Back Propagation）网络是 1986 年由 Rinehart 和 McClelland 为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。 BP 网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。 BP 神经网络模型拓扑结构包括输入层（input）、隐层(hide layer)和输出层(output layer)（如图 5.2 所示）。 5.4.1 BP 神经元图 5.3 给出了第 j 个基本 BP 神经元（节点），它只模仿了生物神经元所具有的三个最基本也是最重要的功能：加权、求和与转移。其中 x1、 x2…xi…xn 分别代表来自神经元 1、 2…i…n 的输入；wj1、wj2…wji…wjn 则分别表示神经元 1、2…i…n 与第 j 个神经元的连接强度，即权值；bj 为阈值；f(·)为传递函数；yj 为第 j 个神经元的输出。第 j 个神经元的净输入值为：（5.12）其中：

若视，，即令及包括及，则于是节点 j 的净输入可表示为：（5.13）净输入 :通过传递函数（Transfer Function）f (·)后，便得到第 j 个神经元的输出（5.14）式中 f(·)是单调上升函数，而且必须是有界函数，因为细胞传递的信号不可能无限增加，必有一最大值。 5.4.2 BP 网络 BP 算法由数据流的前向计算（正向传播）和误差信号的反向传播两个过程构成。正向传播时，传播方向为输入层→隐层→输出层，每层神经元的状态只影响下一层神经元。若在输出层得不到期望的输出，则转向误差信号的反向传播流程。通过这两个过程的交替进行，在权向量空间执行误差函数梯度下降策略，动态迭代搜索一组权向量，使网络误差函数达到最小值，从而完成信息提取和记忆过程。 5.4.2.1 正向传播

设 BP 网络的输入层有 n 个节点，隐层有 q 个节点，输出层有 m 个节点，输入层与隐层之间的权值为，隐层与输出层之间的权值为，如图 5.4 所示。隐层的传递函数为 f1(·)，输出层的传递函数为 f2(·)，则隐层节点的输出为（将阈值写入求和项中）：k=1,2,……q 输出层节点的输出为：（5.15）j=1,2,……m 至此 B-P 网络就完成了 n 维空间向量对 m 维空间的近似映射。 5.4.2.2 反向传播 1) 定义误差函数（5.16）输入个学习样本，用来表示。第个样本输入到网络后得到输出（j=1,2,…m）。采用平方型误差函数，于是得到第 p 个样本的误差 Ep：（5.17）式中：对于为期望输出。个样本，全局误差为：

（5.18） 2）输出层权值的变化采用累计误差 BP 算法调整，使全局误差变小，即（5.19）式中： —学习率定义误差信号为：（5.20）其中第一项：（5.21）第二项：（5.22）是输出层传递函数的偏微分。于是：（5.23）由链定理得：

（5.24）于是输出层各神经元的权值调整公式为：（5.25） 3）隐层权值的变化（5.26）定义误差信号为：（5.27）其中第一项：（5.28）依链定理有：（5.29）第二项：（5.30）是隐层传递函数的偏微分。于是：

（5.31）由链定理得：（5.32）从而得到隐层各神经元的权值调整公式为：（5.33） 5.4.3 BP 算法的改进 BP 算法理论具有依据可靠、推导过程严谨、精度较高、通用性较好等优点，但标准 BP 算法存在以下缺点：收敛速度缓慢；容易陷入局部极小值；难以确定隐层数和隐层节点个数。在实际应用中，BP 算法很难胜任，因此出现了很多改进算法。 1）利用动量法改进 BP 算法标准 BP 算法实质上是一种简单的最速下降静态寻优方法，在修正 W(K)时，只按照第 K 步的负梯度方向进行修正，而没有考虑到以前积累的经验，即以前时刻的梯度方向，从而常常使学习过程发生振荡，收敛缓慢。动量法权值调整算法的具体做法是：将上一次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上，作为本次的实际权值调整量，即：（5.34）其中：α为动量系数，通常 0＜α＜0.9；η—学习率，范围在 0.001～10 之间。这种方法所加的动量因子实际上相当于阻尼项，它减小了学习过程中的振荡趋势，从而改善了收敛性。动量法降低了网络对于误差曲面局部细节的敏感性，有效的抑制了网络陷入局部极小。 2）自适应调整学习速率

标准 BP 算法收敛速度缓慢的一个重要原因是学习率选择不当，学习率选得太小，收敛太慢；学习率选得太大，则有可能修正过头，导致振荡甚至发散。可采用图 5.5 所示的自适应方法调整学习率。调整的基本指导思想是：在学习收敛的情况下，增大η，以缩短学习时间；当η偏大致使不能收敛时，要及时减小η，直到收敛为止。3）动量-自适应学习速率调整算法采用动量法时，BP 算法可以找到更优的解；采用自适应学习速率法时，BP 算法可以缩短训练时间。将以上两种方法结合起来，就得到动量-自适应学习速率调整算法。 4） L-M 学习规则 L-M（Levenberg-Marquardt）算法比前述几种使用梯度下降法的 BP 算法要快得多，但对于复杂问题，这种方法需要相当大的存储空间。L-M(Levenberg-Marquardt)优化方法的权值调整率选为:（5.35）其中：e—误差向量；J—网络误差对权值导数的雅可比（Jacobian）矩阵；μ—标量，当 μ很大时上式接近于梯度法，当μ很小时上式变成了 Gauss-Newton 法，在这种方法中，μ 也是自适应调整的。综合考虑，拟采用 L-M 学习规则和动量法分别作为神经网络的训练函数和学习函数。5.5 BP 神经网络的训练策略及结果本文借助于 MATLAB 神经网络工具箱来实现多层前馈 BP 网络（Multi-layer feed-forward backpropagation network）的颜色空间转换，免去了许多编写计算机程序的烦恼。神经网络的实际输出值与输入值以及各权值和阈值有关，为了使实际输出值与网络期望输出值相吻合，可用含有一定数量学习样本的样本集和相应期望输出值的集合来训练网络。训练时仍然使用本章 5.2 节中所述的实测样本数据。

另外，目前尚未找到较好的网络构造方法。确定神经网络的结构和权系数来描述给定的映射或逼近一个未知的映射，只能通过学习方式得到满足要求的网络模型。神经网络的学习可以理解为：对确定的网络结构，寻找一组满足要求的权系数，使给定的误差函数最小。设计多层前馈网络时，主要侧重试验、探讨多种模型方案，在实验中改进，直到选取一个满意方案为止，可按下列步骤进行：对任何实际问题先都只选用一个隐层；使用很少的隐层节点数；不断增加隐层节点数，直到获得满意性能为止；否则再采用两个隐层重复上述过程。训练过程实际上是根据目标值与网络输出值之间误差的大小反复调整权值和阈值，直到此误差达到预定值为止。 5.5.1 确定 BP 网络的结构确定了网络层数、每层节点数、传递函数、初始权系数、学习算法等也就确定了 BP 网络。确定这些选项时有一定的指导原则，但更多的是靠经验和试凑。 1）隐层数的确定： 1998 年 Robert Hecht-Nielson 证明了对任何在闭区间内的连续函数，都可以用一个隐层的 BP 网络来逼近，因而一个三层的 BP 网络可以完成任意的 n 维到 m 维的映照。因此我们从含有一个隐层的网络开始进行训练。 2） BP 网络常用传递函数:BP 网络的传递函数有多种。Log-sigmoid 型函数的输入值可取任意值，输出值在 0 和 1 之间；tan-sigmod 型传递函数 tansig 的输入值可取任意值，输出值在-1 到+1 之间；线性传递函数 purelin 的输入与输出值可取任意值。BP 网络通常有一个或多个隐层，该层中的神

经元均采用 sigmoid 型传递函数，输出层的神经元则采用线性传递函数，整个网络的输出可以取任意值。各种传递函数如图 5.6 所示。只改变传递函数而其余参数均固定，用本章 5.2 节所述的样本集训练 BP 网络时发现，传递函数使用 tansig 函数时要比 logsig 函数的误差小。于是在以后的训练中隐层传递函数改用 tansig 函数，输出层传递函数仍选用 purelin 函数。 3）每层节点数的确定：使用神经网络的目的是实现摄像机输出 RGB 颜色空间与 CIE-XYZ 色空间转换，因此 BP 网络的输入层和输出层的节点个数分别为 3。下面主要介绍隐层节点数量的确定。对于多层前馈网络来说，隐层节点数的确定是成败的关键。若数量太少，则网络所能获取的用以解决问题的信息太少；若数量太多，不仅增加训练时间，更重要的是隐层节点过多还可能出现所谓“过渡吻合”（Overfitting）问题，即测试误差增大导致泛化能力下降，因此合理选择隐层节点数非常重要。关于隐层数及其节点数的选择比较复杂，一般原则是：在能正确反映输入输出关系的基础上，应选用较少的隐层节点数，以使网络结构尽量简单。本论文中采用网络结构增长型方法，即先设置较少的节点数，对网络进行训练，并测试学习误差，然后逐渐增加节点数，直到学习误差不再有明显减少为止。 5.5.2 误差的选取在神经网络训练过程中选择均方误差 MSE 较为合理，原因如下： ① 标准 BP 算法中，误差定义为：（5.36）每个样本作用时，都对权矩阵进行了一次修改。由于每次权矩阵的修改都没有考虑权值修改后其它样本作用的输出误差是否也减小，因此将导致迭代次数增加。 ② 累计误差 BP 算法的全局误差定义为：（5.37）

这种算法是为了减小整个训练集的全局误差，而不针对某一特定样本，因此如果作某种修改能使全局误差减小，并不等于说每一个特定样本的误差也都能同时减小。它不能用来比较 P 和 m 不同的网络性能。因为对于同一网络来说，P 越大，E 也越大； P 值相同，m 越大 E 也越大。 ③ 均方误差 MSE：（5.38）其中:—输出节点的个数， —训练样本数目，—网络期望输出值，—网络实际输出值。均方误差克服了上述两种算法的缺点，所以选用均方误差算法较合理。 5.5.3 训练结果训练一个单隐层的三层 BP 网络，根据如下经验公式选择隐层节点数[125]：（5.39）式中：n 为输入节点个数，m 为输出节点个数，a 为 1 到 10 之间的常数。针对本论文 n1 取值范围为 3～13。训练结果如表 5.1 所示。表 5.1隐层神经元个数 3 4 5 6 7 8 9 10 11 12隐层节点数与误差的关系训练误差 1.25661 0.797746 0.631849 0.570214 0.552873 0.445118 0.385578 0.259624 0.185749 0.183878 测试误差 1.1275 0.8232 0.7278 0.6707 0.6895 0.6575 0.6497 0.4555 0.6644 0.48

130.1685870.6671由上表可以看出： ① 增加隐层节点数可以减少训练误差，但超过 10 以后测试误差产生波动，即泛化能力发生变化。综合比较隐层节点数为 10 与 12 的训练误差和测试误差，决定隐层节点数选用 12。 ② 训练误差和测试误差都很大,而且收敛速度极慢（训练过程如图 5.7 所示），这个问题可以通过对输出量进行归一化来解决。根据 Sigmoid 型传递函数输入和输出的范围，对输入变量不进行归一化处理，只对输出变量进行归一化，这是因为在输出数据要求归一化的同时，对输入数据也进行归一化的话，权值的可解释性就更差了。目标值按下式进行变化：（5.40）使目标值落在 0.05～0.95 之间，这样靠近数据变化区间端点的网络输出值就有一波动范围，网络的性能较好。用新生成的训练样本与测试样本对隐层节点数为 12 的网络进行训练，得到的训练误差为 9.89028×10-5，测试误差为 1.9899×10-4，达到了预定的目标（训练过程如图 5.8 所示）。

5.6 最终训练后的神经网络结构采用三层 BP 网络实现摄像机输出 RGB 颜色空间与 CIEXYZ 色空间转换，其中隐层含有 12 个节点，传递函数采用 tansig 函数；输出层传递函数选用 purelin 函数。经过测试后结果满意，可以认为该神经网络可以用来实现这个关系映射。网络的结构如图 5.9 所示：

得到的 BP 神经网络的权值和阈值为：

5.7 本章小结1) 定量地分析了用线性关系转换摄像机 RGB 空间到 CIE-XYZ 空间数据后产生的均方误差，表明 CCD 摄像机与标准观察者之间有比较明显的差别，也就是说 RGB 与 CIE-XYZ 间的转换是非线性的。 2) 采用 MATLAB 中神经网络工具箱实现多层前馈 BP 网络的 RGB 到 CIEXYZ 颜色空间转换，用经过归一化的训练样本与测试样本对隐层节点数为 12 的三层网络进行训练，得到的训练误差为 9.89028×10-5，测试误差为 1.9899×10-4，结果表明经过训练的多层前馈 BP 网络可以满足 RGB 空间向 CIEXYZ 颜色空间转换要求，达到了预定目标。 3) 确定了用于 RGB 和 XYZ 颜色空间转换的 BP 网络结构，并求出了该神经网络的权值和阈值。使用该网络可以定量表达食品颜色，定量比较高压加工食品颜色的变化，可以使食品颜色测定和控制实现定量化，而不再是主观性很强的模糊描述。

与《BP神经网络的基本原理》相关的范文

10-17 浙江传媒学院文史.理工类招生计划

二、文史、理工类专业录取办法我校文史类、理工类专业录取按国家有关文史类、理工类专业录取的规定办理。具体细则： 1、学校调档比例一般按1：1.1。进档考生以高考总分为主要依据，综合考查德智体状况和相关单科成绩进行录取。 2、按照考生报考学校志愿先后录取。即先录取院校第一志愿的考生，若第一志愿不满时，再录取院校第二志愿考生；实行平行志愿投档的省份按各省考试院的相关规定执行。 3、学校录取专业时设一定 ...

02-19 有关毕业设计工作要求

一、毕业设计的目的 ·总结：对在学期间所学知识的检验与总结 ·培养：培养和提高独立分析问题和解决问题的能力 ·训练：使学生受到科学研究、工程设计和撰写技术报告的基本训练二、毕业设计的选题要求 ·究结合生产、科研及技术设备的革新、改造等 ·先进性 ·实用性三、题目类型及基本要求 ·论证性题目论文意义论点论据具体论证结论及应用 ·设计性题目设计内容设计依据具体设计方案及设计步骤设 ...

02-22 远程培训学习笔记:课程与教学理论发展的轨迹与启示

远程培训学习笔记：课程与教学理论发展的轨迹与启示科学化课程开发理论发展的里程碑（1-3-2）美国著名教育学家、课程理论专家、评价理论专家泰勒对科学化课程开发理论起里程碑作用。他所提出的泰勒原理被当作课程研究的范式。由于泰勒对教育评价理论、课程理论的卓越贡献，被誉为“现代评价理论之父”“现代课程理论之父”。 1934年，泰勒出版了《成绩测验的编制》，确立其评价原理；1949年，又出版了《课程与教 ...

11-21 2014高三物理复习计划

20xx高三物理复习计划高三物理总复习的指导思想就是通过物理总复习，把握物理概念及其相互关系，熟练把握物理规律、公式及应用，总结解题方法与技巧，从而提高分析问题和解决问题的能力。根据物理学科的特点，把物理总复习分为三个阶段：第一阶段：以章、节为单元进行单元复习练习，时间上约从高三上学期到高三下学期期中考试前，即头年九月到第二年三月初，大约需要六个月，这一阶段主要针对各单元知识点及相关知识点 ...

12-11 辅修专业教学计划

《生物技术》辅修专业教学计划一、专业培养目标本辅修专业培养生物技术及其相关领域的应用型人才。二、专业培养要求本辅修专业的学生通过学习可获得以下几方面知识、能力和素质： 1、掌握生命科学和生物技术等方面的基本理论和基本知识，具有一定的生物工程原理的基础知识； 2、掌握生物技术方面的基本实验技能； 3、具有综合运用所掌握的理论知识和技能，从事生物技术及其相关领域产品研发、生产、管理的能力； 4 ...

09-28 2014年高考政治主观题得分技巧与方法

20XX年高考政治主观题得分技巧与方法一、主观题失分的主要表现 1、审题不清，答错答题的范围，即答非所问。例如，题目要求用经济常识的有关知识来回答，有些学生却用政治常识甚至哲学常识的知识来回答；题目要求用唯物辩证法的有关知识来回答，有些学生却用辩证唯物论的知识来回答。 2、张冠李戴，答案前后不对应。这在哲学试题中表现得尤为突出。例如，前面用矛盾的普遍性原理后面却用具体问题具体分析的方法论与其相对 ...

01-05 中学政治组教学常规"五化"经验总结

教学常规“五化”（备课信息化、上课高效化、作业考试化、辅导个性化、考试高考化），我们主要在前二化上做文章，力求有新的突破。一、备课信息化什么是备课信息化？学校领导只是提出这一命题，而没有明确的解释，也没有具体的要求，我们只能瞎揣摩，各显神通。我们是这样想的，充分利用现代信息技术给我们带来的方便，提高备课的效率和质量。 1、充分认识备课信息化的重要性有位特级教师说：“我在用一生的时间备一节课。 ...

10-16 电子工作室2014年上学期辅导计划

电子工作室20XX年上学期辅导计划一、指导思想结合高职教育的特点，以培养学生学习兴趣和锻炼学生动手操作能力与创新能力为目的，开展20XX年上学期电子工作室的辅导工作。二、辅导目标： 1、充分调动学生对电子专业的热爱和学习兴趣 2、让学生熟练掌握电子元件的认识、检测与使用 3、让学生熟练掌握电子仪表的使用与操作 4、使学生具有电子电路组装、制作、调试与检修能力 5、使部分学生具有简单电子产品的 ...

11-19 2014年九年级物理复习计划

20XX年九年级物理复习计划物理是中考必考科目，与其他科目相比，具有以下特点；①知识点多、知识面广②物理概念、物理规律需要理解③物理实验的方法及操作需要掌握④会应用物理知识分析和解决生活、生产实际问题等。针对物理学科的这些特点，怎样确定复习方向、复习方法，进行高效复习呢？下面是xx年中考物理复习的计划。　　　　一、明确中考物理命题的趋向　　纵观近几年中考物理试题，可以发现中考物理命题切实体现 ...

08-21 2014年九年级物理复习计划

随机推荐

猜你喜欢

BP神经网络的基本原理

·雷锋月开幕主持词

·毕业论文设计总结

·幼儿教师学习吴邵萍事迹心得:爱为根本乐享工作

·木梁承重比赛策划书

·12.1作文开头导学案

·创业者身上往往具有这些优良品质

·十首最美五言古诗,美得令人心醉,每一首都是千古名篇

·浅析中西方文化中会面礼仪的差异

·连云港市市属事业单位考试试题

·现代通信真方便教学设计

·在全市文化工作会议上的发言

·郭明义事迹读后感

·人教版初中一年级历史期末试卷及答案

·企业职工代表大会实施细则-规章制度

·怎样进行集体备课

·浅谈档案管理工作新特点

·学生会女生部部门活动总结

·师德案例分析

·世界清凉饮料市场概况

·工程项目设计阶段投资控制

BP神经网络的基本原理

与《BP神经网络的基本原理》相关的范文

·雷锋月开幕主持词

·毕业论文设计总结

·幼儿教师学习吴邵萍事迹心得:爱为根本 乐享工作

·木梁承重比赛策划书

·12.1作文开头导学案

·创业者身上往往具有这些优良品质

·十首最美五言古诗,美得令人心醉,每一首都是千古名篇

·浅析中西方文化中会面礼仪的差异

·连云港市市属事业单位考试试题

·现代通信真方便教学设计

·在全市文化工作会议上的发言

·郭明义事迹读后感

·人教版初中一年级历史期末试卷及答案

·企业职工代表大会实施细则-规章制度

·怎样进行集体备课

·浅谈档案管理工作新特点

·学生会女生部部门活动总结

·师德案例分析

·世界清凉饮料市场概况

·工程项目设计阶段投资控制

·幼儿教师学习吴邵萍事迹心得:爱为根本乐享工作