经典最小二乘与全最小二乘法及其参数估计

12-05

理论新探

经典最小二乘与全最小二乘法及其参数估计

王福昌1，曹慧荣2，朱红霞2

（1.中国地震局防灾科技学院基础部，河北三河065201；2.廊坊师范学院数信学院，河北廊坊065000）

摘要：文章对经典的最小二乘和全最小二乘方法的应用背景、原理与算法进行了介绍，给出

了它们在线性模型参数估计中的MATLAB实现；通过计算机仿真说明了在模型中所有变量均具有不可忽略的误差时，全最小二乘法得到的参数估计更接近于真实参数。

关键词：最小二乘；全最小二乘；线性模型中图分类号：O212

文献标识码：A

文章编号：1002-6487（2009）01-0016-02

在模型的参数估计中，最常见的一种拟合准则是经典的最小二乘法，该准则下参数估计特别简单，其假设检验也容易进行。值得指出的是，经典的最小二乘法要求解释变量均为精确无误差的，或其测量误差与模型的因变量的测量误差相比可以忽略不计，所有误差均来自于因变量，这在很多情形下是不能满足的，因而人们提出了考虑解释变量误差模型的全最小二乘（TotalLeastSquares）准则，又叫做正交最小二乘(OrthogonalLeastSquares,OLS)、变量含误差模型(Errors–In-Variables,EV，EIV)、度量误差模型（ErrorMeasurement

记X=

ΣΣΣΣΣΣΣ…ΣΣΣΣΣ

x11x21xn1

……

x1px

………

…

ΣΣΣΣ2pΣ

ΣΣΣΣΣΣnpΣ

，β=

ΣΣ0ΣΣΣ1ΣΣ…ΣΣΣΣp

bbbΣΣΣΣΣΣΣΣΣΣΣ

，Y=

ΣΣ1ΣΣΣ2ΣΣ…ΣΣΣΣΣn

ΣΣΣΣΣΣΣΣΣΣΣΣ

，则问题（1）变为

Q2=Σεi2=||Y-Xβ||2=(Y-Xβ)T(T-Xβ)

i=1

（2）

由向量微分理论可知，对Q2关于向量β求导，令鄣Q=-

2XT(y-Xβ)，由实际意义可知问题的最优解为

赞LS=（XTX）-1XTyβ

（3）

Model）和随机回归模型(RandomRegressor)等等。近年来，全

最小二乘法在统计分析、线性和非线性回归、系统辨识和参数估计及信号处理中有广泛的应用，成为数理统计和数值代数方向的热门问题之一。

本文拟针对线性模型，给出估计参数的算法和实现

赞由于MATLAB是一种向量化编程语言，因此计算系数β

特别简便。在MATLAB语言中使用命令Beta=X\y或者

Beta=pinv(X’*X)*X’*y皆可得到参数估计值。2

线性模型参数估计的全最小二乘法

在经典的最小二乘法中，误差被定义为数据点沿着因变量y轴方向到拟合函数的偏差。而当模型中难以区分因变量和解释变量时，即所有变量都有不可忽略的误差时，使用经典的最小二乘法已经不再合适。这就需要使用考虑了所有变量误差的全最小二乘法。全最小二乘法按照与经典最小二乘法不同的距离标准来估计参数，这时是寻找参数b0,b1,b2,…,

MATLAB源程序，并对两种方法进行计算机仿真，希望研究

结果对使用最小二乘法解决实际问题的科技工作者具有一定的参考价值。

1线性模型参数估计的最小二乘法

已知多元线性模型中有p+1个参数b0,b1,b2,…,bp待定，解

释变量x1,x2,…,xp和因变量y有n次测量值(n>p+1)，假设满足

bp使得数据点(xi1,xi2,…,xip,yi)到超平面距离残差平方和

yi=b0+b1xi1+b2xi2+…+bpxip+εi(i=1,2,…,n)

这是一个超定线性系统，方程可能没有解。在经典的最

QT=Σε=(1+Σb)

i=1

j=1

2-1j

i=1

Σ[y-(b+bx+bx+…+bx)]

1i1

2i2

pip

（4）

小二乘法中，假设x1,x2,…,xp的观测值没有误差，寻找参数b0,

取得最小值。如再记Xi=[1,x11,x12,…,x1p]，β0=[b1,b2,…,bp]T，则问题为

b1,b2,…,bp使得沿着y轴方向的残差平方和

Q2=Σε=Σ[yi-(b0+b1xi1+b2xi2+…+bpxip)]

i=1

（1）

QT=Σε=(1+ββ0)

2Ti

i=1

-1

i=1

Σ(y-xβ)

（5）

取得最小值。

问题（4）可以看成一个多元函数的最小值问题，可以用无约束优化的有效算法如BFGS算法求解，也可以用下面的

Gauss-Newton迭代法和SVD分解方法求解。2.1

统计与决策２００9年第1期（总第２77期）

用Gauss-Newton迭代法估计参数β

理论新探

軃軃1軃軃軃軃軃2軃軃軃軃軃軃軃軃

y-(b0+b1x11+b2x12+…+bpx1p)

姨1+b+…+b

向量值函数F(β)=

y-(b0+b2x21+b2x22+…+bpx2p)

姨1+b+…+b姨1+b+…+b

yn-(b0+b1xn1+bnxn2+…+bpxnp)

軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃

軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃

y1-x1β

1(1+βT0β0)y1-x2β

(1+βT0β0)y1-xnβ

1(1+βT0β0)

軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃

赞OT=(ATA-σp+12I)-(3)计算过原点的超平面的全最小二乘解β

ATb；

赞TLS=[b-Aβ赞(4)平移得到原始问题的全最小二乘回归系数β

，令

赞OT]。;β

MATLAB程序略。

计算机仿真

为直观起见，讨论二维平面上确定拟合直线的情形。假

F(β)=0（6）

2.3

其中O为维列向量，则求问题（6）最小二乘解与求问题（4）的最小值点是等价的，可以通过Gauss-Newton迭代方法求解。

相应的向量值函数F(β)关于向量β的Jacobi矩阵为

軃

軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃

设原始的直线方程为y=b+kx，其中b=1,k=0.5，围绕这条直线产生一组正态分布的随机数据，然后分别用经典最小二乘和全最小二乘法确定回归系数系数，并进行比较。

-b0

-x11(1+βT0β0）-b1（y1-x1β)…-x1p(1+βT0β0）-bp（y1-x1β)

(1+ββ0)

(1+ββ0)-b0

(1+ββ0)

DF(β)=鄣F

(1+ββ0)-b0

-x21(1+ββ0）-b1（y1-x2β)…-x2p(1+ββ0）-bp（y1-x2β)

(1+ββ0)

(1+ββ0)T0

(1+βT0β0)

-xn1(1+βT0β0）-b1（y1-xnβ)…-xnp(1+βT0β0）-bp（y1-xnβ)

(1+βT0β0)

軃

軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃軃

利用MATLAB编写程序，独立运行50次，得到的仿真结果见表1。

表1

独立运行50次的得到的回归系数比较

截距均值和标准差

经典最小二乘法全最小二乘法

斜率均值和标准差

1.5511±0.69641.0689±0.74750.4436±0.06100.4915±0.0673

估计β的Gauss-Newton迭代算法描述如下：

(1)取初值β(0)，指定精度ε；

(2)计算向量值函数F(β)和函数的Jacobi矩阵Ak=DF

(k)

由于原始的系数为1和0.5，可见全最小二乘法得到回归系数更接近原始系数，只是由它得到的回归系数的标准差稍大一些。

为了进一步比较，在图1中虚线表示原始的直线方程，实点表示围绕这条直线产生一组正态分布的随机数据，实线表示按照经典最小二乘法和全最小二乘法确定的直线。

(β)进行迭代：β=β-(AAk)F(β)，k=0,1,2,…；

(k)

(k+1)

(k)

-1

(k)

(3)若||β(k+1)-β(k)||

如算法迭代停止，则迭代序列{β}收敛于线性模型参数

(k)

赞TLS。的全最小二乘估计β

尽管这种方法理论上存在着初始解选取和迭代序列发

赞LS为初始值β(0)可散的问题，但实际经验表明多数情形下以β赞TLS。以很快收敛到β的全最小二乘估计β2.2

用SVD分解法估计参数

为便于理解，从几何的观点考察线性拟合问题。对于2维数据来说，要寻找1维的一条直线近似刻画它们的关系；对于3维数据来说，要找2维的一张平面来近似刻画它们的关系。假设有p+1维空间中一组数据，我们要用p维子空间

图1随机仿真31个数据点情形下回归结果比较

从图1中可以看出，全最小二乘法得到的回归直线与原始直线几乎重合，而经典最小二乘法与原始直线差别较大。

(直线、平面或超平面)来拟合p+1维空间中的数据，因此这是

数值分析上的一个降秩逼近问题，可以使用奇异值分解

3结果与讨论

本文讨论了线性模型系数估计的经典最小二乘法和全

(SVD)方法解决。算法如下：

(1)考虑到计算简便和数据点到超平面的距离平方和与

超平面是否通过原点无关，首先对数据平移，记平移后的数

軃

軃軃11軃軃軃軃21軃軃軃…軃軃軃軃n1

最小二乘法，给出了估计参数的算法和MATLAB源程序，对两种方法进行了计算机仿真，发现在模型中所有变量均含有误差时，由全最小二乘法得到回归参数与真实模型参数更为接近。这些算法和程序对于使用最小二乘法解决工程问题的科技工作者具有一定的参考价值。

参考文献：

軃x-x軃…x-x軃x-x12121p軃x-x軃…x-x軃x-x12222p

…

据为A=

軃x-x軃…x-x軃x-x12n2np

軃

軃p軃軃軃軃p軃軃軃軃軃軃軃p軃

，b=

軃軃軃1軃軃軃軃2軃軃軃…軃軃軃軃n

軃y-y軃y-y

軃y-y

軃

軃軃軃軃軃軃軃軃軃軃軃軃軃

，其中j=1

Σx，j=

i=1

1,2,…,p；1

Σy。

i=1

(2)对M=[Ab]进行奇异值分解，使得M=USVT，其中U、V

为正交阵，S=diag(σ12,σ22,…,σp+12)，σ12≥σ22≥σp+12≥0为对角阵。

[1]程龙生.基于errors-in-variables的预测模型及其应用[J].数理统计与管理,2005,24(2).

(责任编辑/亦民)

统计与决策２００9年第1期（总第２77期）

与《经典最小二乘与全最小二乘法及其参数估计》相关的范文

06-29 高一数学下学期教学计划

一、指导思想：使学生在九年义务教育数学课程的基础上，进一步提高作为未来公民所必要的数学素养，以满足个人发展与社会进步的需要。具体目标如下。 1．获得必要的数学基础知识和基本技能，理解基本的数学概念、数学结论的本质，了解概念、结论等产生的背景、应用，体会其中所蕴涵的数学思想和方法，以及它们在后续学习中的作用。通过不同形式的自主学习、探究活动，体验数学发现和创造的历程。 2．提高空间想像、抽象概括、 ...

07-29 高一数学下学期教学计划2

02-28 2014年度上学期二年级班主任工作.语文教学.数学教学计划

20xx-20xx学年度上学期二年级班主任工作、语文教学、数学教学计划二年级班主任工作计划一、班级基本情况和目标：　　我班共有学生28人。本学期我班的基本目标是：全体同学都能树立明确的学习目的，形成良好的学习风气；继续抓好学生的常规教育，强化《小学生日常行为规范》的落实，培养学生良好的行为习惯。培养学生强烈的责任感、班级荣誉感，以及自我约束，自我管理的能力。　　二、基本措施和做法：　　1 ...

07-03 二年级数学下册教学计划

一、教学内容这册教材包括下面一些内容：解决问题、表内除法（一）、图形与变化、表内除（二）、万以内数的认识、克和千克的认识、万以内的加法和减法（一）、统计、找规律、总复习等。这册教材的计算教学内容是万以内的加、减法笔算和表内除法。这两部分内容都是进一步学习计算的重要基础。因此，表内除法同20以内的加、减法一样，是小学数学的重要基础知识，是小学生需要掌握的除法是人们在日常生活中解决问题时经常用到的数 ...

04-24 2014年小学数学二年级上册教学计划

20xx学年小学数学二年级上册教学计划龙口西小学刘聪玲一、班级基本情况分析本学期我任教二年1班和二年9班的数学，学生通过一年级新教材学习，已经适应新课程的教材特点，顺利度过小学适应期，逐步有良好的学习习惯。在数学学习上，无论是口算还是解决问题，都有很大的进步，但在审题和解决问题策略使用上差异性比较大，有些孩子审题意识差，认字比较少，对于人民币运用方面能力比较差，涉及连加、连减以及加减混合 ...

01-13 新教材试验总结

新教材试验总结北师大版小学数学教材是新课程标准的实验教材，在与教材“亲密接触”后，它理念新、选材新的特点，更深深地打动了我。它打破了固有的思维定势，给学生和老师的个性发展创造了更多的空间。我在使用了新教材三年后，再回头看它，又有了新的认识，在使用过程中感到有些地方还值得商榷。新教材中虽然有许多新鲜和启人心智的地方，但是使用前如果不认真钻研，查阅参考书籍或与其他教师共同研讨，是不容易把握好的。现将 ...

04-10 高二数学下学期备课组教学计划

教学目标、教材的重点通过推理与证明的教学，进一步体会合情推理、演绎推理以及二者之间的联系与差异；体会数学证明的特点，了解数学证明的基本方法，包括直接证明的方法和间接证明的方法；感受逻辑证明在数学以及日常生活中的作用，养成言之有理、论证有据的习惯。通过计数原理的教学，使学生掌握两个基本计数原理、排列、组合、二项式定理及应用，会解决简单的计数问题；体验计数与现实生活的联系，充分体会两个基本计数原理 ...

10-06 二年级数学教学计划

二年级数学教学计划学生知识现状的分析我班有学生39人，男生22人，女生17人。一年来学习习惯基本养成,上课时能积极思考,积极发言,作业认真按时完成.大部分同学能够熟练地口算100以内的加减法,能提出并解决简单的问题.对位置、图形、统计等方面的知识也能较好地掌握.有几位学生还没达到计算正确、迅速,上课注意力不集中，做题速度慢，作业不能按时完成，今后要加强辅导。本学期教学任务和要求 1、初步认 ...

02-07 人教版三年级数学下册教学计划

人教版三年级数学下册教学计划一、班级情况分析本班共有18名学生，其中男生11人，女生7人。通过上学期的教育与学习，学生的一些基本能力得到了很大的提升，已经初步养成了自己独立思考、动手、动脑的正确学习习惯，对待学习的态度良好。但是有一少部分学生过于活泼好动，纪律观念还不够强，无集体意识，缺乏合作精神，还有一部分学生缺乏积极主动地学习习惯需要教师和家长的督促才能完成学习任务。二、本册教材分析本 ...

09-06 四年级下册数学教学计划

四年级下册数学教学计划一、学生情况分析本学期带两个班数学，一班28人，二班28人。大部分学生基础较好，学习自觉性高，其中一班在上学期市教育局组织的统一质量监测中成绩名列前茅，二班的成绩较低一些，但也居全市前列。但仍有个别学生的学习习惯不太好，基础较差！学习散慢，缺乏学习的自觉性主动性，习惯也不好。像宁浩、王鹏、马平等。其中张家旺、马鑫、马凯玉、罗依杰这些同学学习成绩优异，思维灵活，对待问题常常 ...

随机推荐

猜你喜欢

经典最小二乘与全最小二乘法及其参数估计

·勤工助学义务劳动"先进个人"表扬稿

·乡镇党委书记在教师节表彰大会上的讲话

·任期目标责任书

·2011年党务先进工作者事迹材料

·微电影网络时代的概念泡沫

·大脖子病治疗

·教案09 第九章创业计划与实践演练

·透过教师职业角色浅析教师的专业素养

·美国债务危机与次贷危机的对比

·"一带一路"与中国贸易

·优秀教师经验交流讲话稿

·优秀团干部事迹简介

·旅美交往二十戒

·学校艺体工作计划

·*镇创建"五四红旗"团委汇报材料

·高中军训总结会学生代表发言稿

·你为什么选择做采购?

·初中化学校本课程计划

·苍鹰教子阅读答案

·五年级经典阅读题

经典最小二乘与全最小二乘法及其参数估计

与《经典最小二乘与全最小二乘法及其参数估计》相关的范文

·勤工助学义务劳动"先进个人"表扬稿

·乡镇党委书记在教师节表彰大会上的讲话

·任期目标责任书

·2011年党务先进工作者事迹材料

·微电影网络时代的概念泡沫

·大脖子病治疗

·教案09 第九章 创业计划与实践演练

·透过教师职业角色浅析教师的专业素养

·美国债务危机与次贷危机的对比

·"一带一路"与中国贸易

·优秀教师经验交流讲话稿

·优秀团干部事迹简介

·旅美交往二十戒

·学校艺体工作计划

·*镇创建"五四红旗"团委汇报材料

·高中军训总结会学生代表发言稿

·你为什么选择做采购?

·初中化学校本课程计划

·苍鹰教子阅读答案

·五年级经典阅读题

·教案09 第九章创业计划与实践演练