第二章_ 条件期望及现代观点下计量经济的
Chapter2 现代观点下计量经济的
基本理念和理论基础
§1 问题的提出
从数据谈起
模型、数据哪个是第一位的?传统观点是模型第一位,现代观点认为数据是第一位的。我们不应当假设数据满足模型的条件,而应当要求模型适应数据的特点,这是现代观点下计量经济的出发点。
a.如果手头有一些数据,x1…xn,它能告诉你什么?什么也没有!因为我们不
知道数据来源背景,从而不知道数据所表达的含义。
b.如果该数据是某人历次考试成绩的记录,它能告诉你什么?可以认为,X 是某人的学习能力,称为总体(population),x1…xn是学习能力的观测或反映,它是取自总体X中的样本,可建立简单模型:X=a+ε,a是真值,是客观存在1的能力,但不可观测。于是用=∑xi就反映了该学生的学习能力水平,N
1ˆvar(X)=(xi-2就反映了该生学习能力的稳定性。等等。 ∑N-1
c.但是,如果该数据是某企业的股票价格,那么就没有理由认为x1…xn是相ˆX)就有可能不再有一互独立的,而是一个与时间有关联的序列,那么和var(
个稳定的极限。例如随机游走,xt=xt-1+εt=x0+∑εi,εt N(0,σ2)∀t。则
i=1t
ˆt)=tσ2→∞,t→∞。从而xt显得不可预测,这样的数据以前认为是没有用var(
的,但在现在的随机过程理论和计算机技术下,我们仍能从{Xt}中捕捉到“股票价值”X的某些信息。
这里,我们看到,经济中数据的来源是非常复杂的,有的可以看成是服从某一分布的随机变量的取值,有的则是某一特定的随机过程的实现,甚至是不平稳过程的实现。
d、进一步对于有相互关联的多组数据,x11…x1N, ,xk1…xkN,y1…yN,同样我们首先要知道数据的来源,知道有关X1 XK和Y的知识,这一点与传统观点是一致的。但传统观点的局限是,解释变量X1…Xk是确定性的,与误差项ε无关。而这种要求的数据一般只在实验室中才能做到,大量经济数据一般事前无法
安排,并且解释变量之间也存在关联性,解释变量与误差项之间也有关联性,另外,数据是不可重复的。为此,现实经济要求我们对数据的限制要放宽。我们做如下的陈述:
假设:(1)我们关注的对象称为总体(Population)Y是一个随机变量;
(2)认为影响总体Y的原因是一个K维随机变量,X'=(X1…XK)';
(3)(Y,X)的联合分布存在,且存在期望和方差;
(4)可以从(Y,X)随机抽取观测样本(random sampling),或抽取受各种限制的观测样本。
提出的问题是,如果能从(Y,X)获取观测样本(信息),如何调整对(Y,X)的认识?即如何用X来表达Y?
注:(1)(Y,X)的联合分布、期望、方差存在,并不意味着已知。
(2)Y与X的因果关系中,X的分量Xi对Y的影响既有轻重之分,又有可观测和不可观测之分,甚至有半不可观测的情况。即Y与X的因果关系可以按理论要求更加随意的设定。
例如,我们关注的是工资与教育的关系,但是影响工资的因素除了教育之外,根据劳动经济学的知识,还有工作经验和能力。其中,工作经验可用工作年限表示,又由于工作经验有正外部性,故可设计工作经验的平方作为另一个解释变量,而能力则是不可观测的,如chapter1的例1,但仍可以放在因果关系中,不过需要有特殊的处理。
(3)因果关系不一定是线性关系,从平均意义或期望的意义上讲,我们要关注的是条件期望E(Y|X)。E(Y|X)的直观含义是如果知道X,平均意义上看Y是什么?它包含比从总体平均意义上看Y是什么,即EY有更多的信息。并且希望能把E(Y|X)表达出来,建立一个模型,称为总体模型(population model)。
(4)随机抽取样本的最基本形式是截面数据(cross section data),含义是给定一个固定的时间点或是时间段上,解释变量与因变量的数据是从总体中随机发生的,而实验数据(experimental data)的含义是实验者预先设定或不受干扰的测定解释变量的实验值,然后观测因变量的结果值,传统观点下X的样本假定为实验数据,ε与实验数据X是完全分开的,指的是一切其他环境对结果的随机影响。这个要求太强。除了截面数据,随机样本的另外几种形式有:
Pooled cross section data 在不同时间点样本独立,但不同分布(混同样本); Spatial correlation 在不同地区样本有相关性,不独立(空间相关性样本); Cluster sample 时间数据有分段特征(串数据);
Panel data称面板数据,数据有二元特征,特别是有时间特征,但时间不太长,有限。
这些特殊样本的处理,特别是面板数据我们在后面的模型中专门分析、介绍。
§2 有关理论
下面着手建立解决上述问题的一套基本理论。
假设Y=g(X)是客观存在,但是未知或者部分未知,那么获取数据资料以后,从获取的数据(y1…yn)和(x11…x1n,xk1…xkn)中就应当反映这种客观存在的关系,Yi=g(Xi),i=1 n。进一步,如果Y=g(X)的函数关系也不清楚,那么找一个什么样的函数关系是合理的?合理性的准确含义(标准)又是什么?
着手解决两个问题:
1、合理性按均方误差标准。即选择g(X)使得其与Y的误差平方最小,∀g(X)MinE(Y-g(X))2,简记成MSE(mean square error)。
2、如果用线性关系X'β来表达Y,具备什么条件才能使满足条件1中解就是g*(X)=X'β*,即MinE(Y-g(X))2与MinE(Y-X'β)2等价。 ∀g(X)∀β
我们有如下的基本定理:
定理1:用条件期望E(Y|X)来表达Y,则MSE最小。即:
E(Y|X)=argMinE(Y-g(X))2=g*(X), arg表示满足取最小值条件的g(X)。 ∀g(X)
首先复习一下条件期望的概念及性质:
关于条件概率,我们知道,P(AB)=P(A⋂B),P(B)>0。此意味着存在一个概P(B)
率空间(Ω,F,P),且B∈F。因为事件B已发生,所以P(AB)实质是将P(B)>0改变成P(B)=1,以及把事件A的概率P(A)调整为A在B中的比例。
现在如果让A遍历整个F,这就在(Ω,F,P)上定义了一个新的概率PB。它是由B和P导出的概率。并可认为构成一个新的概率空间(Ω,F,PB)。这是在事件B发生的条件下获得的对原概率P的调整。直观讲就是,因为B已经发生了,其他与B无关的事件已不重要了,B取代了Ω的地位。
设Y是(Ω,F,P)上的一个随机变量,那么,数学期望EY=⎰YdP。这是一个Ω
在Ω上的加权平均。现在把Y放到概率空间(Ω,F,PB)上看,那么应有,条件数学期望E(YB)=⎰YdPB=⎰B
ΩYdP(B)。这是一个在事件B上的加权平均。
再设Y、X是(Ω,F,P)上的二个随机变量,联合分布存在。∀x0∈R,为要使P(B)>0,取B={x0-∆x≤X
极限是存在有限的。因为零概率集上可测函数的积分总是0,故我们可以在这个零概率集上重新定义它的值,例如取值为0, 那么,对∀x0∈R,E(YX=x0)有定义。这是一个与随机变量X取值有关的函数f(x0)。(回忆导数的定义)
因为X是随机取值的,所以当X不确定取值的时候,它就是一个与X有关的随机变量。记成E(YX)。称为Y关于X的条件数学期望。
注,给定事件下的条件期望是一个数,而随机变量Y关于随机变量X的条件数学期望则是一个随机变量。具体计算就是,如果E(YX=x)=f(x),则:
(参阅伍书第一章) E(YX)=f(X)。
条件期望有性质如下:
设随机变量(X,Y)有联合分布F(x,y)和联合分布密度f(x,y),不妨设f(x,y)≥0。则X的边际分布密度fx(X)=⎰f(x,y)dy;Y的边际分布密度
Y
。那么给定X=x的条件下,Y的条件分布密度是fy(Y)=⎰f(x,y)dx
X
fY|X(y|x) f(x,y)=fX(x)f(x,y)
Y⎰f(x,y)dy,于是给定X=x的条件下,Y的条件数学期望是E(Y|X=x)=⎰y
Yf(x,y)dy g(x)。所以E(Y|X)=g(X)。 fX(x)
⎡⎡⎤f(x,y)⎤f(x,y)∴E(g(X))=E[E(Y|X)]=⎰⎢⎰ydy⎥fX(x)dx=⎰⎢⎰yfX(x)dx⎥dy fX(x)⎦fX(x)X⎣YY⎣X⎦
⎡⎤=⎰y⎢⎰f(x,y)dx⎥dy=⎰yfY(y)dy=E(Y)
Y⎣X⎦Y
性质1:E[E(Y|X)]=E(Y),直观含义是分段平均再平均等于直接平均。
又由定义,E[g(X)|X]=
f(x,y)dy=E(Y|X)。 fX(x)g(X)⎰g(x)f(x,g(X))dg(x),做变量代换,y=g(x),fX(x)则:⎰y
Y
性质2:E[E(Y|X)|X]=E(Y|X)。
E[g(X)|X)]=g(X)的直观含义很明显,已经知道X的信息,那么g(X)的平均就是它自己。即知道X=x,那么g(X)=g(x)就是已知的。它是常数的期望等于常数的直接推广。
注:性质1和2有广泛应用。
有了上述准备,我们证明定理1。设g0(X)=E(Y|X),那么,
E(Y-g(X))2 =E(Y-g0(X)+g0(X)-g(X))2
=E(Y-g0(X))2+E(g0(X)-g(X))2+2E(g0(X)-g(X))(Y-g0(X))
注意到,E(g0(X)-g(X))(Y-g0(X))=E{E[(g0(X)-g(X))(Y-g0(X))|X]} =E{(g0(X)-g(X))E[(Y-g0(X))|X]}=E{(g0(X)-g(X))[E(Y|X)-g0(X)]} =0。 ∴MSE(g)=E(Y-g(X))2+E(g0(X)-g(X))2。
所以取g(X)=g0(X),MSE(g)最小。定理得证。
注:这个定理很重要,它奠定了条件期望在均方误标准下的最优地位,问题是 当Y与X的联合分布很复杂,甚至不知时,E(YX)实质上仍然是不清楚的。
例:随机参数过程:
2设Y=β0+(β1+β2η)X+η,其中η与X独立,且E(η)=0,var(η)=ση,则,
E(Y|X)=E(β0+(β1+β2η)X+η|X)=β0+E((β1+β2η)X|X)+E(η|X) =β0+β1X+XE(β2η|X)+E(η|X)=β0+β1X+β2XE(η)+E(η)=β0+β1X。
22var(Y|X)=E⎡⎣(Y-E(Y|X))|X⎤⎦=E⎡⎣(β0+(β1+β2η)X+η-β0-β1X)|X⎤⎦
2222222⎤⎡⎤=E⎡(η+βηX)|X=Eη(1+βX)|X=(1+βX)E(η|X)=(1+βX)ση。 2222⎣⎦⎣⎦
注:我们也可以将模型看成,Y=β0+β1X+μ,但是μ=(1+β1X)η,于是μ
就与X相关,如果有其他的解释变量与X相关,内生性就产生了。且条件方差var(u|X)也与X相关。大量的计量经济模型都是由于环境既影响结果又影响原因,从而内生性和条件异方差性往往是不可避免的,关键要看影响的程度。这正是现代观点要处理的问题,传统观点假定X与μ无关的要求太强了,不符合实际。 一般情况下,E(YX)仍很复杂,甚至是未知的,所以,尽管我们知道E(YX)在均方误标准下表达Y是最优的,但是我们需要一种方法,用其他的合理方式来取代E(YX),取代的方式取决于不同的目的,这就是问题(2)。
如果目的是预测、是趋势,可采用非参数估计方法,这超出本书的范围,请参阅相关非参数估计的书。如果目的是政策评价,验证理论是否正确,一般采用参数估计方法,参数估计方法的理论基础就是线性投影。
设 是影响Y的一切原因集,β=(β0,β1, ,βk)'是一个K+1维的参数空间,βi∈R,是未知的。X'=(1,X1……Xk)是取自 中的K+1维向量,并且线性无关。例如X与X2线性无关,但lnX和lnX2线性相关。
定义:A={g(X)=β0+β1X1+ +βkXk}={g(X)=X'β,β∈Rk+1}⊂Φ
注:我们只要求g(X)关于β是线性的,对X不做任何要求,A的直观含义是从母体X中提取部分X1……Xl外加常数项构成K+1维向量X,把X与β做内积,构成β的线性函数集A,于是我们可以把求E(Y|X)的问题转化为求未知参数向量β的问题,即:
g(X)∈A2' minE(Y-g(X))2=minE(Y-Xβ)k+1β∈R
当然,A中的函数要比中Φ的少,但是限制在A中,却使问题变得可以求解了。
定理2:若E(Y)2≤∞且E(XX')存在非奇异,那么中A的最小二乘解g*(X)=Xβ*,β*=E(XX')-1E(XY)。
证明:由一阶条件得:
kk⎡⎤dd∂222'E(Y-Xβ)=E(Y-∑βiXi)=E⎢ ,(Y-∑βiXi), ⎥ dβdβ∂βi=0i=0i⎣⎦
=-2E(Y-X'β)X'=-2E(X(Y-X'β))=0
⇒E(XY)-E(XX')β=0。
由E(XX')非奇异,E(XY)≤E(X)2E(Y)2 (施瓦茨不等式)
故E(XY)
注:一般g(X)=X'β*≠E(Y|X)。这是非线性回归模型要解决的问题。 下面考虑设定(specification)Y=Xβ+u, β∈Rk+1。称为Y的(关于β线性)模型,其中μ为回归误差。
定理3:设定Y=X'β+u,则当且仅当垂直条件E(Xu)=0成立,有β=β*成立。 证明:必要性:如果β=β*,那么由u=Y-X'β⇒
EXu=EXY-EXX'β*=EXY-(EXX')(EXX')-1(EXY)=0;
充分性:如果EXu=0,那么,EXu=EXY-EXX'β=0。∴β=(EX' X)-1EXY=β*。注:1)特别取X=1⇒Eu=0
2)这里没有考虑E(Y|X),仅是说明当Y写成β的线性投影形式时,当β=β*时,μ要满足的条件,它比E(Y|X)=0要弱。
下面解决的问题是,把Y写成Y=g(X)+ε与把Y写成Y=X'β+u,在什么条件下是一致的,这个条件也就是现代观点下的多元线性回归模型的前提假定。
定义:线性回归模型Y=X'β+u,称为正确设定的(correct model specification)如果存在某一β0∈Rk+1,使得从母体 选取K个向量有E(Y|X)=X'β0成立,否则,如果对所有的β∈Rk+1,E(Y|X)≠X'β,则称线性回归模型不是正确设定的。
定理4:线性模型Y=X'β+u,是正确设定的,那么:
1)存在某一β0,使得Y=X'β0+ε,且E(ε|X)=0;
2)E(Xε)=0;
3)β*=β0。
证明:由定义,E(Y|X)=X'β0,由定理1的性质知,E(ε|X)=0 (1)成立
再由定理3,(2)(3)成立。
∂E(Y|X)=β0,故当模型是正确设定时,参数β0的经济含义是注:1)由∂X
边际效果,(βi=∂Y,i=1,2,„„),否则β的含义是误导的。 ∂Xi
2)若Y=X'β+u,且E(Xu)=0,不是正确设定的,则意味着:
此时,若采用最小二乘法估计,参数βE(Y|X)=Xβ+E(u|X)≠Xβ,即E(u|X)≠0。
会产生有偏、不一致的后果。这正是本课程要重点解决的问题。
接下来的问题是,在正确设定下,知真值β=β*=(EX'X)-1EXY。 如何获得?当然是通过样本,利用大数律,保证一致性。
§3大样本下渐近理论基础
现代回归模型的估计和检验由于样本N不再固定,更注重一致性,基本原则是保证一致性成立,降低有偏性,提高有效性。从而,样本的极限理论具有基本的重要性。
1、收敛的概念:
a) 序列{an}收敛,记为an→a
pb) 随机变量序列{xn}依概率收敛,xn−−→x
dc) 随机变量序列{xn}依分布收敛,xn−−→x
pd) 连续映照定理(Slutsky’s Theory),向量序列xn−−→const,g(x)连续,
p则g(xn)−−→g(c),即plimg(xn)=g(plimxn)。 n→∞n→∞
2、随机样本的极限定理
定理1 :设{wi:i=1,2, }是一列独立同分布的G维随机向量序列,且
1Np→uw,其中uw=E(wi),此称为向量E(|wig|)
序列的弱大数定律。
定理2:{wi:i=1,2, }是一列独立同分布G维随机向量序列,且
E(|wig|)
02w=ii=1Nwi=1Nid−−→N(0,B),
B=var(wi)是一半正定矩阵。此称为向量序列的中心极限定理。
在定理1、2的基础上,我们定义一致性:
ˆ:N=1,2……定义1:(一致性){θ}是一个P×1维的样本函数的序列,NN
pˆN−−ˆ∈Θ成立,则称θˆ是θ的一致估计,是样本容量,如果θ→θ,对任意的θNN
其中Θ是未知参数空间的定义域。
ˆ:N=1,2……定义2:{θ}是一个P×1维的样本函数的序列,如
果N
dˆ-θ)−−ˆ渐近正态的,且V
θ→N(0,V,)其中V是半正定阵,则称θ
NN
ˆ Normal(θ,V),ˆ-θ)的渐近方差,
ˆ-θ)=V。θθ记作因此,AθNNNN
ˆ的渐近方差为V,记成Avar(θˆ)=V/N。 故也称θNNN
ˆ的ˆ,因此θ一般而言, 协差阵V未知,我们有许多关于V的一致估计VNN
ˆ)=Vˆ/N,记成Avar(θˆ/N。 渐近方差估计就是VNN
注:因为Vˆ/N→0,故当N充分大,Vˆ/N无意义。→0,(N→∞),所以VNNN
ˆ的渐近方差估计,
ˆ-θ)的渐近方差估计是Vˆ/N是θˆ,我们说VθNNNN
ˆ/N→0,这一点很重要,不要搞乱。 而不是VN
dˆ-θ)−−定义3
θ→Normal(0,V),且V正定,其主对角线元素N
pˆ的第j个分量θˆNj的渐近标准差规定ˆ,且Vˆ−−用vjj表示。又有V→V,那么θNNN
1/2ˆ)=ˆjj/N)为se(θ。 (νNj
ˆ和θ 都是θ
的定义4:θNNˆ-θ=o(N-1/一致估计,即θNp),2
-θ=o(N-1/2),
ˆ-
θ且V=Av如果D-V是arθNpN)θ,D=AθN-θ),
ˆ比θ 是渐近有效的。
ˆ和θ
是ˆ-θ )=o(1),半正定矩阵,则称θθ则称θNNNNNNp
渐近等价的。
⎡V1 0⎤dˆ定义5
:如果θN-θ)−−→Normal(0,V),若V=⎢⎥,且相应的0 V⎣2⎦
ˆ⎤⎡θˆˆ-θ)有渐近方差V
θˆ-θ)有渐近方差V,则称θN=⎢1N⎥θ121N12N2ˆ⎢⎣θ2N⎥⎦
ˆ是渐近独立的。 估计θˆN1和θN2
关于统计检验的渐近理论有:
定义6:对假设检验H0,如果它的备择假设H1为真,且N→∞limPN(拒绝H0|H1真)=1,则称检验是渐近一致的。
dˆ-θ)−−引理:
θ→N(0,V),V正定,N
dˆ-θ)−−又R是Q×P矩阵,Q≤P,秩(R)=Q,
(θ→Normal(0,RVR')。N
d2-1ˆ-θ)⎤RVRˆ(-θ⎤)又,二次
型(θ(')θ−−→χNNQ,此外如果有⎦⎦'
ˆ=V,那么Wald统计量,即二次型:
plimVNN→∞
ˆ⎡V⎤d-12ˆˆˆˆ-θ)−−(θN-θ)⎤(RVR')(θN-θ)⎤=(θN-θ)'R'⎢RNR'⎥R(θ→χNQ⎦⎦⎣N⎦
在第一章我们看到,利用Wald统计量,我们可以得到F统计量,并由此解'-1决有线性约束的检验问题,H0:Rθ=r,H1:Rθ≠r。
(为保持与伍书中符号一致性,R相当经典模型中的C,r相当于q)。
最后,简单介绍参数假设检验的大样本理论:
设θ∈Θ是总体中的参数向量,Θ⊂Rk。q为已知的J维列向量,C(θ)为θ的J元函数,C(θ)=(c1(θ), ,cJ(θ))'。称C(θ)=q为对参数θ的约束条件,J为约束的个数。这里C(θ)的函数形式已知,可以是线性的,也可以是非线性的。且∂C(θ)=Q(θ)在θ的某邻域行满秩。 ∂θ
如果能把对参数θ的约束条件作为假设检验的命题:H0:C(θ)=q,H1:C(θ)≠q。那么,由数理统计的知识,在大样本条件下,可采用三个渐近等价的检验统计量来完成。具体讲:
ˆ是θ的一致估计,由于最大似然估计(MLE)在大样本条件下满足一设θN
ˆ常采用MLE作为假设致性、渐近正态性和不变性,有很好的统计性质。一般θN
ˆ为不带约束条件下θ的一致估计,θˆ为带约束条检验前θ的一致估计。我们记θUR
ˆ)为似然函数值。我们有如下结论:件下θ的一致估计。设L(θ)为似然函数,L(θ
(1) 沃尔德统计量(Wald)
ˆ易得,那么对假设检验的命题:如果不带约束条件下θ的一致估计θU
H0:C(θ)=q,且秩∂C(θ)=Q。可构造Wald统计量: ∂θ
d2ˆ)-q]'[AVar(C(θˆ)-q)]-1[C(θˆ)-q]−−。特别当约束是线性时,即W=[C(θ→χQUUU
ˆ⎡V⎤d2Nˆˆ-r)−−Rθ=r,那么有W=(θN-r)'R'⎢R()R'⎥R(θ。 →χQNN⎣⎦-1
(2) 拉格朗日统计量(LM)
∂C(θ)ˆ易得,=r。 如果带约束条件下θ的一致估计θ那么对,秩H:C(θ)=q0R∂θ
可构造LM统计量:
ˆ)ˆ∂lnL(θd-1∂lnL(θR)RˆLM=()'[I(θR)]()−−→χr2。其中,I(θR)=-E(HR)=E(gg');∂θ∂θRR
∂lnL(θR)∂2lnL(θR),H=。称I(θR)为信息矩阵。 g='∂θR∂θR∂θR
(3)似然比统计量(LR) 令λ=lnL(θR)dˆ=2[lnL(θˆ)-lnL(θˆ)]−−,称为似然比,LR=-2lnλ→χr2。似然URlnL(θU)
比检验常在时间序列分析中用。
注:当约束是线性时,有W≥LR≥LM。故LM拒绝,则都拒绝H0。
本章小结
本章的内容承上启下,核心概念是条件数学期望,怎么强调也不过分。后面的内容都是围绕着条件期望的性质建立各种模型展开的。此外,假设检验的三个基本统计量也是后面各种假设检验的理论基础,各种检验统计量都是在它们的基础上建立的。本章的内容在后面继续学习时还要经常回头看,故把重点小结如下:
1、现代观点:数据本位,模型要适应数据的要求。
2、现代观点基本理念:
(1)关注的目标Y是一个随机变量,它与影响它的因素X,X是一个多维随机向量,存在联合分布,并且可以随机抽样。X和Y允许受到限制,或某些因素不一定可观测,且X和的Y期望和方差均存在、有限。
(2)用X表达Y,Y=g(X),在均方误差最小(MSE)的意义下,g*(X)= E(Y|X)是最优的,且令Y=E(Y|X)+U,则E(U|X)=0。
(3)线性投影(参数估计方法),在X中抽取l个变量,(l
当E(XX')非奇异,且E(Y2)
-1β*=[E(XX')]E(XY),在MSE意义下是最优的,且则最小二乘估计β,*
E(XU)=0,⇔β=β*
(4)定义模型是正确设定的,如果存在β0∈Rk+1,使得E(Y|X)=Xβ0 ,于是可知β0=β*,E(XU)=0;反之模型不是正确设定的,则E(XU)=0不等于0,从而E(U|X)≠0,称模型存在内生性问题,即X与U相关。
要特别强调的是,“正确设定”只是一个强制性的假设,当E(Y|X)本质上
β2是非线性的,如:E(Y|X)=α1X1β1+α2X2+……+αkXkβk,则任何有限的线性表
达都不可能是正确设定的。又如,E(Y|X)是分段的阶梯函数,用线性表达和加入虚拟变量显然留下了更多人为的痕迹。非线性模型的参数估计,是下册书的主要内容。也正是有了各种条件期望的概念,线性模型和非线性模型才统一起来了,无非是用X的不同函数形式来表达E(YX)。
(5)样本多样性
1)截面数据cross section data iid
2)面板数据panel data 二元特征
3)混合数据pooled data 独立但不同分布
4)时间序列数据time series
5)空间相关数据
6)串数据
3、渐近理论与统计量
(1)3
渐近正态性:
①向量序列的弱大数定律(WLL)
②向量序列的中心极限定理(CLT)
③随机变量(向量)序列趋于常量的连续映照定理(Slutsky’s Theory)
渐近正态性
(2)3个基本统计量:
d2ˆ)-q]'[AVar(C(θˆ)-q)]-1[C(θˆ)-q]−−Wald统计量:W=[C(θ →χQUUU
ˆ)ˆ∂lnL(θd-1∂lnL(θR)RˆLM统计量:LM=()'[I(θR)]()−−→χr2 ∂θ∂θRR
dˆ)-lnL(θˆ)]−−LR统计量:LR=-2lnλ=2[lnL(θ→χr2 。 UR