基本极限分布理论和线性检验统计量的构造

05-25

基本极限分布理论和线性检验统计量的构造

一、基本极限分布理论

1．对于序列a N ，如果对于任意ε，存在N ε使得对于N >N ε时，有|a N -a |

p 3．依概率收敛：对于所有T ≥N ，有Pr ob {|X T -c |>δ}

p p −→c ，则g (X T ) −性质1：g (⋅) 为连续函数，若X T −−→g (c ) ；

p p p p 性质2：X 1T −−→c 1，X 2T −−→c 2，则{X 1T +X 2T }−−→(c 1+c 2) ；[X 1T ]-1[X 2T ]−−→c 1-1c 2

D 4．依分布收敛：记F X T (x ) 为X T 的分布函数，若lim F X T (x ) =F X (x ) ，则X T −−→X ； T →∞

D p D 性质1：Y T −−→Y ，若(X T -Y T ) −−→0；则X T −−→Y （渐近等价引理）

D D D p 性质2：X T −−→Y ，则{X T +Y T }−−→c +Y ；{X T ' Y T }−−→c ' Y ； −→c ，Y T −

D D 性质3：X T −−→X ，g (X T ) −−→g (X ) （连续影射定理）

D D p 性质4：向量X T −−→Y ~N (μ, Ω) ；X T Y T −−→cY ~N (c μ, c Ωc ' ) ； −→c ，Y T −

二、推导统计量渐近分布时的有用结论及应用 ˆ~N (β, σ2(X '1．βX ) -1)

1．若X ~N (μ, I n ) ，则X 'X ~χ2(n , λ) ，λ=∑μi 2（非中心参数）

2．N 维随机变量X ~N (0, V ) ，则X 'V -1X ~χ2(n ) （证明思路为对V -1进行楚勒斯基分解，即V -1=P P '）

3．N 维随机变量X ~N (0, V ) ，BV 为幂等矩阵，则X 'BX ~χ2(rank (B )) R β=r ）

ˆ-β(βˆ-β) /σˆ-βββ=~N (0, (X 'X ) -1) ；1．t 统计量。t 统计量的计算形式为，则) ) /σσse (βse (β

ˆ) =(β) =s (X ' X ) se (β2-1ˆ'u ˆu ˆ) ˆ'u u u se (β-1（~N (0, I ) ） =(X 'X ) ；=(X 'X ) -1；σT -k σT -k

ˆ-β) /σ(β故~se (β) /σN (0, I ) χ2

(T -k ) 为t 分布。 T -k )

2．F 统计量。F 统计量的计算形式为(SSR 1-SSR 0) /q ，q 为约束个数，SSR 1和SSR 0分别为SSR 0/(T -k )

ˆ-r ) '(R (X 'X ) -1R ') -1(R βˆ-r ) /q (SSR (R β1-SSR 0) /q 受限模型和非受限的残差平方和。则=SSR 0/(T -k ) s 2

ˆ'u ˆu 2-1ˆ-r ~N (0, σ2R (X ''s =（*）；R β；。（*）式上下同除以σ2得到： X ) R ) T -k

ˆ-r R βσ~N (0, R (X 'X ) -1R ') ，ˆu

σ~N (0, I ) ，由相关结论可知统计量服从F 分布。

注意：无论是t 统计量还是F 统计量只有当残差严格服从正态分布的时候才是有效的。

三、计量经济学中的假设检验

1．计量经济建模中需要哪些检验

从经济理论出发、选择解释变量、构建回归方程到模型的参数估计量的求解，再到该模型能否解释所研究的经济现象的本质特征或所研究的经济活动中的各个因素之间的关系，最后到能否进行模型的实际应用，必须通过各种检验加以确定。一般来讲，计量经济建模需要进行三个方面检验：（1）设定检验（Specification Test ），即将数据生成设定为某一种具体形式以便进行参数估计；（2）经济意义的检验，即根据经济理论对某个约束条件进行检验；（3）诊断检验（Diagnose Test），即判断参数估计是否具有显著性，以及模型设定是否合理。设定检验一般包括：正态性检验、异方差检验、序列相关性检验、单位根检验、协整检验、面板数据模型形式设定检验、个体效应固定效应检验、针对非线性模型的线性检验等。

2．检验的形式Wald 检验、似然比检验和LM 检验（得分检验、Rao 检验）

2.1 Wald检验

Wald 检验与F 检验类似，通常适用于残差不是严格服从正态分布的情况，主要优点是应用简单，并且不需要对受限模型进行估计。Wald 检验的基本思想是如果约束条件为真，则未受限模型的估计量近似等价于受限模型估计量。由于最值估计量（M-Estimator ，即通过求解一系列最大化或者最小化目标函数得出参数估计，Huber ，1967年提出，包括普通最小二乘法、非线性最小二乘法、最大似然估计和准极大似然估计等）渐近服从正态分布，即

d ˆ-β) −n (β−→N (0, V ) 。则在原假设下有R β0=r ，故0

d ˆ-r ) '(RVR ) -1(R βˆ-r ) −n (R β−→χ2(q ) ，q 为约束条件个数。 d ˆ-r ) −n (R β−→N (0, RV R ') ，

2.2 得分检验

某些情况下，受限模型比非受限模型具有更简单的形式，因此在构造检验统计量时人们希望只估计受限模型（原假设下的模型）。以线性检验为例，原假设为模型是线性的，备择假设为模型是非线性，显然估计线性模型（原假设成立下的模型）更为简单。这就是提出得分

ˆ应该渐近服检验的初衷。该检验的基本思想是，如果原假设成立，则目标函数的梯度向量λ

d ˆ=(R (X 'ˆ-r ) ，n λˆ−从均值为零的正态分布，即λX ) -1R ') -1(R β−→N (0, Ω) ；则得分检验的统-1⎛'R (X X ) R '⎫ˆd 2ˆ' ⎪计量λλ−−→χ(q ) 。得分检验最初是针对最大似然估计提出的（也就是LM 2 ⎪σ0⎝⎭

检验），但是其基本思想可以应用于许多估计方法。

2.3 似然比检验

构造Wald 检验要求估计非受限模型，构造得分检验要求估计受限模型，而似然比检验需

~ˆ) -ln L (θ要同时估计受限和非受限模型。统计量的计算表达式为：LR =2(lnL (θ)) ~χ2(q ) ；θˆ

~~为非受限估计量，θ为受限估计量。为了证明似然比统计量服从χ2分布，需要将ln L (θ) 在θˆ~~ˆ~ˆˆ) +n (θˆ)(θ-θ) 'H (θ-θ) （根据最大似然估计的定义，处二阶泰勒级数展开得到ln L (θ) ≈ln L (θ2

~ˆ~ˆˆ)(θˆ) +I (θˆ) =0，则：一阶展开项为0），则LR ≈-n (θ-θ) 'H (θ-θ) ；由于H (θ

~ˆ~ˆ~ˆ~ˆˆ)(θˆ) n (θLR ≈n (θ-θ) 'I (θ-θ) =n (θ-θ) 'I (θ-θ) ~χ2(q )

2.4 Wald检验、似然比检验、得分检验的渐近等价性

通过（2.1）~（2.3）不难发现，wald 检验、得分检验和似然比检验统计量都渐近服从χ2分布，那么它们之间是否存在某种联系呢？是的！这三种检验以及qF 统计量在原假设成立时是渐近等价的，即qF =W =LM =LR 。下面对这三个检验统计量进行总结：（1）LR 统计量的构造是建立在似然函数基础上的，因此它依赖于对残差的分布做出假设；（2）qF 统计量又被称为伪似然比统计量，因为其构造同样依赖受限和非受限估计量。二者的区别是qF 统计量不需要对分布做出假设；（3）Wald 检验和得分检验是针对线性模型提出的，但是它们的基本思想同样适用于非线性模型。

尽管这些统计量是渐近等价的，但从数值计算的角度来看三者还是存在差别的，这是由

于方差估计的不同方法造成的。这就带来一个问题，人们可以根据偏好有选择地使用某种检验得到想要的结果。因此，在实证应用中，理想的解决方法是同时给出三种统计量的检验结果。

3．统计量临界值的计算

统计量临界值的计算都是以统计量的极限分布为基础的，具体来说有两种方法：（1）如果统计量的极限分布是标准的，则可以直接查相应的分布表；（2）大多数情况下，统计量的分布形式要么非标准要么难以计算，此时需要运用模拟方法。举例来说，单位根检验的统计ˆ-1) ˆ-1(ββ(1/2)[W (1) 2-1]量为DF =，其中W(r)为(0,1)内的维纳过程。显然=~T 1/22-1/21s (β) s u (∑t =1y t -1) ⎡W 2(r ) dr ⎤⎢⎥⎣⎰0⎦

计算该统计量的分布函数是极为困难的。

使用Monte Carlo方法计算统计量的临界值通常分为以下3步：（1）使用原假设成立下的数据生成过程产生样本；（2）构造辅助回归，计算所需要的统计量数值；（3）重复以上两步N 次（N 足够大），并根据要求的检验水平确定统计量数值序列的分位数。下面就以DW 检验和单位根检验为例，介绍这一过程。 DW 检验的原假设为：H 0∑:ρ=0，即u 不存在自相关；检验统计量为DW =t T 2(e -e ) t t -1t =2∑T 2

t t =1e ，

使用的数据生成过程为y t =x t +u t ，u t ~i . i . dN (0, 1) （检验的名义水平为1%，5%，10%） ˆ-1) (βˆ对应的t 统计量，使用单位根检验的原假设为H 0:β=1；检验统计量为DF =，即β) s (β

的数据生成过程为y t =y t -1+u t ，u t ~i . i . dN (0, 1) ，即将检验的辅助回归设定为不含有漂移项和趋势项。（检验的名义水平为1%，5%，10%）

4．检验统计量的（有限样本）性质

4.1 检验功效与检验水平

在假设检验中可能犯两类错误，即第一类错误（“弃真错误”）和第二类错误（“取伪错误”）。不同检验方法犯错误的概率一般是不一样的，而且对于同一种方法，采用不同的统计量或对同一统计量采用不同的参数估计方法，其犯错误的概率也不尽相同。另一方面，检验临界值是在某一假设前提下，在统计量的极限分布基础上（T →∞）计算的，如果待检验的序列较

短，或者假设条件不满足，则统计量的性质（可靠性）会受到影响。因此，为了评价检验的可靠性需要计算统计量在不同样本容量下以及误差项不同设定情况下的检验功效和实际检验水平，这就要用到Monte Carlo模拟的方法。所谓检验功效（Power of Test）是指给定一个名义检验水平，在备择假设H 1成立的条件下，拒绝原假设的概率；实际检验水平（Size of Test）是指，给定一个名义检验水平，当原假设成立的条件下，拒绝原假设的概率。Monte Carlo方法解决这一问题的基本思路是：（1）使用原假设（计算Size ）或备择假设（计算Power ）的数据生成过程生成样本；（2）使用样本序列构造统计量数值，并与临界值比较；（3）重复上述步骤若干次，确定统计量数值小于临界值的频率，从而得到Size 或者Power 。

实验：构造针对数据生成过程y t =β1+β2*y t -1+u t ，β2=0.9的t 检验，计算不同样本容量下t 检验的功效和实际检验水平。提示：计算检验功效时的DGP 为y t =β1+β2*y t -1+u t ，β2={0.2,0.4,0.6,0.8,0.85}；计算检验水平时DGP 为y t =β1+0.9*y t -1+u t 。（名义检验水平为0.05，样本容量分别为T=20，40，80，120，200，1000）

4.2 检验功效与检验水平的权衡关系

统计量的检验水平和检验功效之间存在着一种权衡取舍（trade-off ）的关系，即不论数据生成过程是何种形式，检验水平的值越小，相应的检验功效的值也就越小；检验水平的值越大，相应的检验功效的值也就越大。这也就是说，当某种检验方法犯第一类错误的可能性越小时，其犯第二类错误的可能性就会越大。从这种意义上来说，我们不能奢望某一种检验方法能够同时在这两个方面都明显地优于其他的检验方法。

实验：仍然使用上一个实验的数据生成过程，针对原假设H 0:β2=0. 9，计算大样本下（T=1000）和小样本下（T=25），t 统计量、LM 统计量（χ2版本和F 版本）以及LR 统计量的检验功效和检验水平。

4.3 影响统计量可靠性的因素

我们推导统计量极限分布以及据此计算其临界值的过程都是建立在这样两个假设基础上的：（1）样本容量足够大；（2）残差项独立同分布。（思考：为什么不要求残差服从正态分布？）因此当这两个条件不满足时，统计量的可靠性值得商榷。对于第一个条件，主要是现有统计量的分布和临界值都是在大样本情况下得到的（理解“极限分布”中的“极限”二字）；对于第二个条件，如果数据生成过程存在序列相关或者异方差，我们根本无法得到模型方差-协方差矩阵的一致估计，使得统计量的极限分布（例如，Wald 检验需要估计N (0, V ) 中的V ，得分

2检验需要估计σ0）和标准情况存在很大的偏差。

影响统计量可靠性的另一个因素是冗余参数问题（nuisance parameter ）。所谓冗余参数就是指我们不关心其取值，但其取值又会影响我们分析其他参数的一类参数。假设检验中的冗余参数是指不参与统计量的构造，但其取值会影响统计量可靠性的参数。与之相对应的一个概念就是轴枢统计量（pivotal statistic），即统计量的分布不含有未知参数。简而言之，轴枢统计量就是不含有冗余参数的统计量。

实验：仍然使用上一个实验的数据生成过程和原假设H 0:β2=0. 9，针对不同β1的取值，计算大样本下（T=1000）和小样本下（T=25），t 统计量、LM 统计量（χ2版本和F 版本）以及LR 统计量的检验功效和检验水平。

5．假设检验中的自助法（Bootstrap ）

5.1 Bootstrap的基本概念

在（4.3）小节中我们已经给出影响统计量可靠性的因素，那么如何解决小样本下以及残差非独立同分布下统计量的功效降低或者水平扭曲问题呢？这就要使用自助法（Bootstrap ）。所谓自助法就是指，在原始数据的基础上（“自助”的翻译依据）根据一定规则运用模拟技术构造出若干模拟样本（Bootstrap sample ）并使用这些样本对原始数据进行统计推断（参数估计或者假设检验）的方法。自助法的基本思想是使用基于原始数据信息（样本容量、拟合残差）构造的统计量经验分布代替极限分布用于检验。近年来，自助法普及的原因主要有三个：

（1）计算机运算能力极大提高；（2）自助法易于实施；（3）基于自助法的统计推断具有很好的效果。

5.2 基于Bootstrap 的置信区间估计

我们以一元线性模型介绍基于Bootstrap 的置信区间估计。令y =X β0+u t ，

2ˆ的分布也是未知的，使用传统方法构造βˆu t ~i . i . dN (0, σ0) 。由于u t 分布未知，则小样本下β

的置信区间是不可靠的。使用Bootstrap 的步骤如下：（1）使用OLS 估计模型，得到残差序

ˆ+u b ；ˆt ；ˆt 中选取B 个，构造Bootstrap 样本y b =X β列u （2）有放回的从u t （3）估计模拟样本

ˆ, βˆ，根据显著性水平α确定βˆ，即βˆ的置信区间。得到B 个β(1) (B )

ˆ（原始数据的OLS 估计量）注意事项：（1）构造Bootstrap 样本时务必使用β；（2）Bootstrap

样本容量应该满足αB /2为整数，即对于α=0. 05，B 应为40的倍数，对于α=0. 01，B 应为200的倍数，当然若不考虑计算成本，B 越大越好。

5.3 基于Bootstrap 的假设检验

前提条件：Bootstrap 检验的适用条件是，统计量必须有极限分布（尽管我们不知道该分布的具体形式）。基本步骤：（1）在原假设成立的条件下构造B 个模拟样本；（2）针对原始

ˆ的次数N ，计算p-value=N /(1+B ) ，样本和每个模拟样本计算统计量τˆ和τ*；（3）统计τ*>τ

如果p-value 大于显著性水平α则接受原假设，否则拒绝原假设。在构造模拟样本时需要注意以下几个问题：（1）一定要使用原假设下的估计量；（2）残差序列可以使用原假设下或者备择假设下的估计量。同时，根据模拟残差序列生成方式不同，可以将自助法划分为残差自助法、参数自助法和Wild 自助。下面就以检验y t =β1y t -1+β2+u t 中β1=0. 9为例介绍这三种自助法（使用LM 检验，统计量为LM F =(SSR 0-SSR 1) /m 。

~F (m , T -k -m -1) ）SSR 1/(T -k -m -1)

与《基本极限分布理论和线性检验统计量的构造》相关的范文

07-02 建筑工程技术实习报告

经过4天的认识性实习，我初步的的理解了房屋的构造组成、构造原理及构造办法。进一步进步对建筑文明、建筑学问以及建筑施工、建筑材料的认识，巩固和扩展所学理论学问，进步进修积极性。　　上面就实习与理论学问分离及得到的收获做一些总结　　一、（1）构造方式　　当今的建筑次要采用的是框架构造或者是框架剪力墙构造，砖混构造也采用但用的比较少。我们所观赏的两个施工工地都采用的是框架-剪力构造。它是框架构造和 ...

04-10 高二数学下学期备课组教学计划

教学目标、教材的重点通过推理与证明的教学，进一步体会合情推理、演绎推理以及二者之间的联系与差异；体会数学证明的特点，了解数学证明的基本方法，包括直接证明的方法和间接证明的方法；感受逻辑证明在数学以及日常生活中的作用，养成言之有理、论证有据的习惯。通过计数原理的教学，使学生掌握两个基本计数原理、排列、组合、二项式定理及应用，会解决简单的计数问题；体验计数与现实生活的联系，充分体会两个基本计数原理 ...

02-05 普通地质实习报告(含日记)

普通地质实习报告摘要根据学校的教程安排，进行了为期一周的《普通地质学》野外实习。我们这次实习的目的在于：巩固和加深在课堂学的理论知识，使理论与实践相结合，了解野外地质工作操作步骤，分析沿途所见的岩石的性质以及了解我们萍乡地区地质发展过程。了解了地壳发展的客观规律，认识了一些常见的矿石，为学习后续课程打下稳定的基础。实习地区： 1、五陂下-王坑煤矿 2、孽龙洞 3、三口岩-新泉路段人员 ...

07-18 实习报告(水文)

水文实习（一）河流水文观测衡量和表示河流水文变化情况的因素，一般包括水位、流速、流量、水温、泥沙和水化学。通过上述因素的观测得到的数据，能定量表示河流水情变化的基本特征。 1．水位观测水位观测是河流水文实习的重要内容。观测所得的基础资料可直接应用于水利工程建设，如防汛、给水、灌溉、排水等建筑物的设计，通过水面比降的调查测量，还可以根据水位流量关系推测流量。（1）水位观测断面的布设。一般河道 ...

04-17 地貌实习报告

地貌实习报告姓名：xx xxx 院系：xxx学学院班级：09地理科学一班时间：20XX年6月10日一、地貌学的意义地貌学是研究作为人类生存环境的固体地球表面及表层的物质形态特征、物质组成、内部结构、空间分布、成因及其演变规律的学科。地貌学研究的对象及研究方法随着人类社会及科技发展而发生改变，随着人地关系的改变而改变。地貌学研究，不仅在理论上作为人类对地球家园最基本、最直接的特征-地貌形态 ...

06-29 高一数学下学期教学计划

一、指导思想：使学生在九年义务教育数学课程的基础上，进一步提高作为未来公民所必要的数学素养，以满足个人发展与社会进步的需要。具体目标如下。 1．获得必要的数学基础知识和基本技能，理解基本的数学概念、数学结论的本质，了解概念、结论等产生的背景、应用，体会其中所蕴涵的数学思想和方法，以及它们在后续学习中的作用。通过不同形式的自主学习、探究活动，体验数学发现和创造的历程。 2．提高空间想像、抽象概括、 ...

07-29 高一数学下学期教学计划2

07-09 水利枢纽实习报告

　　一、前言　　1、实习目的　　进一步加固和加深课堂多学过的理论知识，了解主要建筑物的施工特点、施工方法等，培养我们分析问题和解决实际问题的能力，提升自我的专业知识和现场操作技能。　　2、实习任务　　通过理论知识回顾、资料搜集，以及老师讲解、学生提问，实地观察、现场记录参与实验等等方式，对xx水利枢纽工程情况进行现场实习，掌握一定的施工技艺。　　3、实习时间　　20XX年12月x日-1 ...

11-13 高三数学教学进度及复习计划

一、目的为了能做到有计划、有步骤、有效率地完成高三数学学科教学复习工作，正确把握整个复习工作的节奏，明确不同阶段的复习任务及其目标，做到针对性强，使得各方面工作的具体要求落实到位，特制定此计划，并作出具体要求。二、计划 1、第一轮复习顺序：（1）集合与简易逻辑→不等式→函数→导数（含积分）→数列（含数学归纳法、推理与证明）。（2）三角函数→向量→立体几何→解析几何。（3）排列与组合→概率 ...

02-10 工程管理毕业实习报告

　　一．实习单位简介　　我本次实习是在勉县交通局下属单位勉县路桥工程总公司，该公司成立已近40年，具有多年的实地施工经验。曾经参与过川、陕、甘三省交界处市县级公路的建设，近十几年参与建设了国道108、西（安）汉（中）高速公路的建设。施工质量均达到了设计要求。近几年，该公司响应国家建设社会主义新农村的号召，积极投身于农村基础设施的建造，为农村的乡村公路改造贡献自己的力量。　　勉县路桥工程总公司的 ...

随机推荐

猜你喜欢

基本极限分布理论和线性检验统计量的构造

·县国税局经验总结交流材料

·个人读书小结2篇

·称呼和交谈内容要得当

·法语口头禅大全

·身边的一次性用品

·澳洲留学生打工工资退税攻略

·论语桃花源记陋室铭专题阅读

·王家屏传阅读答案

·大宗交易的交易规则

·9个加薪小秘诀教你怎么让领导主动给你加工资

·宣传委员入团申请书范文

·最高额抵押权的概念

·简阳市2015年高中招生适应性考试政治试题及答案

·香港留学2014年香港大学研究生的一般入学要求

·2014年行政实习报告范文

·亚健康对人类健康的影响

·作文凤头猪肚豹尾

·保洁员工作总结

·护士遇到投诉怎么办?诬陷.诽谤.挨打...

·公开招标和邀请招标的区别