应用多元统计(朱建平)课后答案
第二章
2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X=(X1,X2, Xp)'的联合分布密度函数是一个p维的函数,而边际分布讨论是X=(X1,X2, Xp)'的子向量的概率分布,其概率密度函数的维数小于p。
2.2设二维随机向量(X1
解:设(X1
X2)'服从二元正态分布,写出其联合分布。
2⎛σσ12⎫1
,则其联合分布密度函数为
μ2)',协方差矩阵为 2⎪
⎝σ21σ2⎭
X2)'的均值向量为μ=(μ1
2
21
-1/2
⎛σσ12⎫f(x)= 2⎪
⎝σ21σ2⎭
2.3已知随机向量(X1
-1
⎧⎫⎛σ12σ12⎫⎪1⎪exp⎨-(x-μ)' (x-μ)⎬。 2⎪2⎝σ21σ2⎭⎪⎪⎩⎭
X2)'的联合密度函数为
f(x1,x2)=
2[(d-c)(x1-a)+(b-a)(x2-c)-2(x1-a)(x2-c)]
(b-a)2(d-c)2
其中a≤x1≤b,c≤x2≤d。求
(1)随机变量X1和X2的边缘密度函数、均值和方差; (2)随机变量X1和X2的协方差和相关系数; (3)判断X1和X2是否相互独立。
(1)解:随机变量X1和X2的边缘密度函数、均值和方差;
fx1(x1)=⎰
d
c
2[(d-c)(x1-a)+(b-a)(x2-c)-2(x1-a)(x2-c)]
dx 22
(b-a)(d-c)
d
2(d-c)(x1-a)x2=
(b-a)2(d-c)2
c
+⎰
d
c
2[(b-a)(x2-c)-2(x1-a)(x2-c)]
dx2 22
(b-a)(d-c)
d
2(d-c)(x1-a)x2=
(b-a)2(d-c)22(d-c)(x1-a)x2=
(b-a)2(d-c)2
所以
cd
+⎰
d-c
2[(b-a)t-2(x1-a)t]
dt
(b-a)2(d-c)2
d-c
c
[(b-a)t2-2(x1-a)t2]+
(b-a)2(d-c)2
=
1 b-a
(b-a)。 b+a
由于X1服从均匀分布,则均值为,方差为
212
2
⎧1⎪
同理,由于X2服从均匀分布fx2(x2)=⎨d-c
⎪⎩0
(2)解:随机变量X1和X2的协方差和相关系数;
x1∈[c,d]其它
(d-c)。 d+c
,则均值为,方差为
212
2
cov(x1,x2)
=
=⎰
d
c
a+b⎫⎛d+c⎫2[(d-c)(x1-a)+(b-a)(x2-c)-2(x1-a)(x2-c)]⎛
x-x-1dx21⎪2⎪22⎰a 22(b-a)(d-c)⎝⎭⎝⎭
b
(c-d)(b-a)
36
ρ=
cov(x1,x2)
σxσx
1
2
1= 3
(3)解:判断X1和X2是否相互独立。
X1和X2由于f(x1,x2)≠fx1(x1)fx2(x2),所以不独立。
2.4设X=(X1,X2, Xp)'服从正态分布,已知其协方差矩阵∑为对角阵,证明其分量是相互独立的随机变量。
解:因为X=(X1,X2, Xp)'的密度函数为
-1/2⎧1⎫-1
'f(x1,...,xp)=Σexp-(x-μ)Σ(x-μ)⎨⎬ ⎩2⎭⎛σ12⎫
⎪2
σ2⎪ 又由于Σ= ⎪ ⎪2⎪ σp⎭⎝
22
Σ=σ12σ2 σp
p
⎛1
σ2 1 Σ-1=
⎝
1
2σ2
⎫⎪⎪⎪⎪⎪ ⎪
⎪1⎪2⎪σp⎭
则f(x1,...,xp)
⎧⎛1⎪ σ2⎪ 1⎪ p
-1/2⎪1 222-1
'=Σ=σσ
σexp-(x-μ)Σ=⎨12p 2⎪
⎪ ⎪ ⎪
⎝⎩
1
2
σ2
⎫⎫
⎪⎪
⎪⎪
⎪⎪
⎪⎪(x-μ)⎬⎪
⎪⎪
⎪⎪
1⎪⎪2⎪⎪σp⎭⎭
p222⎧-11(xp-μp)⎫⎪1(x1-μ1)1(x2-μ3)⎪
=σσ
σexp---...-()⎨⎬ 12p222
σ12σ22σp⎪⎪⎩2⎭
⎧(xi-μi)2⎫=⎨-⎬=f(x1)...f(xp) 2
2σi⎭i=1⎩
p
则其分量是相互独立。
ˆ==2.5由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为μ
n
∑X
i=1
n
i
ˆ=∑(X-)(X-)' Σii
i=1
⎛35650.00⎫
⎪12.33⎪ˆ== μ
17325.00⎪ 152.50⎪⎪⎝⎭
⎛201588000.0038900.0083722500.00
38900.0013.06716710.00 ˆΣ=
83722500.0016710.0036573750.00 -736800.00-35.800-199875.00⎝-736800.00⎫
⎪
-35.80⎪
-199875.00⎪
⎪
16695.10⎪⎭
0⎤⎡1
11⎢ ⎥
I=)X注:利用p⨯1=X'1n, S=X'(In-1n1'其中nn⎢⎥nn
⎢1⎥⎣0⎦
2.6 渐近无偏性、有效性和一致性;
2.7 设总体服从正态分布,X~Np(μ,Σ),有样本X1,X2,...,Xn。由于是相互独立的正态分布随机向量之和,所以也服从正态分布。又
n
⎛n⎫n
E()=E ∑Xin⎪=∑E(Xi)=∑μ=μ
i=1⎝i=1⎭i=1
1nΣ⎛n⎫1n
D()=D ∑Xin⎪=2∑D(Xi)=2∑Σ=
ni=1n⎝i=1⎭ni=1
所以~Np(μ,Σ)。
1n
ˆ2.8 方法1:Σ=(Xi-)(Xi-)' ∑n-1i=1
1n
'=XiX'∑i-n
n-1i=1
n
1ˆ)='E(ΣE(∑XiX'i-n) n-1i=1
1⎡n⎤
'' =EXX-nE()()∑ii⎢⎥n-1⎣i=1⎦1⎡nΣ⎤1
=Σ-n=∑⎥n-1(n-1)Σ=Σ。 n-1⎢n⎣i=1⎦
方法2:S=
n
∑(X--)'
i
i
i=1
n
' ⎤⎡⎤=∑⎡X-μ-(-μ)X-μ-(-μ)ii⎣⎦⎣⎦
i=1n
=∑(Xi-μ)(Xi-μ)'-2∑(Xi-μ)(-μ)'+n(-μμ-μ)'
i=1n
i=1
n
=∑(Xi-μ)(Xi-μ)'-2n(-μ-μ)'+n(-μ-μ)'
i=1n
=∑(Xi-μ)(Xi-μ)'-n(-μ-μ)'
i=1
S1⎛n⎫E()=E ∑(Xi-μ)(Xi-μ)'-n(-μ-μ)'⎪ n-1n-1⎝i=1⎭1⎛n⎫
''=E(X-μ)(X-μ)-nE(-μ-μ)∑ii⎪=Σ。
n-1 ⎝i=1⎭
故
S
为Σ的无偏估计。 n-1
2.9.设X(1),X(2),...,X(n)是从多元正态分布X~Np(μ,Σ)抽出的一个简单随机样本,试求S的分布。
证明:设
⎛ Γ=
******
*⎫⎪*⎪
*⎪=(γij)为一正交矩阵,即Γ'Γ=I。 ⎪
令Ζ=(Ζ1
Ζ2 Ζn)=(X1X2 Xn)Γ',
由于Xi(i=1,2,3,4, n)独立同正态分布,且Γ为正交矩阵
所以Z'=(Z1
Z2 Zn)独立同正态分布。且有
E
(Ζa)=E(∑rajΧj)
j=1n
n
(a=1,2,3,
,n-1)
=raj
j=1n
'rnj=0 =∑raj
i=1
Var(Ζa)=Var(∑rajΧj)
j=1
2
=∑rVar(Χj)=Σ∑raj=Σ
2
ajj=1
j=1
n
n
n
所以Ζ1Ζ2 Ζn-1独立同N(0,Σ)分布。
又因为S=
n
∑(X
i=1
n
j
-)(Xj-)'
=∑XjX'j-n
'
j=1
nn⎫'
XiXi⎪=ZnZ'因为n'=nn i=1i=1⎭n
又因为
∑XX'=(X
j
j
j=1
1
X2
'⎫⎛X1
⎪ X'⎪
Xn) 2⎪
⎪ X'⎪⎝n⎭
=(X1
X2
⎛X'1⎫ '⎪X2⎪ ' Xn)ΓΓ ⎪ X'⎪⎪⎝n⎭
=(Z1
Z2
⎛Z'1⎫ '⎪Z2⎪ Zn) ⎪ Z'⎪⎪⎝n⎭
n
j
j
n
n
所以原式
∑XX'-ZZ'=∑ZZ'-ZZ'
j
j
n
n
j=1
j=1
n
'+Z2Z'''=Z1Z12+...+ZnZn-ΖnΖn
故S=
∑ZZ',由于Z,Z, ,Z
j
j
1
2
n-1j=1
n-1独立同正态分布
Np(0,Σ),所以
S=∑ZjZ'j~Wp(n-1,∑)
j=1
n-1
2.10.设Xi(ni⨯p)是来自Np(μi,Σi)的简单随机样本,i=1,2,3, ,k,
(1)已知μ1=μ2=...=μk=μ且Σ1=Σ2=...=Σk=Σ,求μ和Σ的估计。 (2)已知Σ1=Σ2=...=Σk=Σ求μ1,μ2,...,,μk和Σ的估计。
1ˆ==解:(1)μ
n1+n2+...+nk
∑∑x
a=1i=1
kna
ai
,
ˆ=Σ
∑∑(x
a=1i=1
kna
a
i
-)(xia-)'
n1+n2+...+nk
(2) lnL(μ1, ,μk,Σ)
=ln⎡⎣(2π)Σ⎤⎦
p
-n1knaa
exp[-∑∑(xi-μa)'Σ-1(xia-μa)]
2a=1i=1
1n1knaa
lnL(μ,Σ)=-pnln(2π)-lnΣ-∑∑(xi-μa)'Σ-1(xia-μa)
222a=1i=1∂lnL(μ,Σ)n-11knaaa-12
'=-Σ+∑∑(Xi-μa)(Xi-μa)(Σ)=0
∂Σ22a=1i=1
∂lnL(μj,Σ)
∂μj
=∑Σ-1(Xij-μj)=0(j=1,2,...,k)
i=1
nj
ˆj=j=解之,得μ
1
nj
ˆ=∑xij,Σ
i=1
nj
∑∑(x
j=1i=1
k
nj
ij
-j)(xij-j)'
n1+n2+...+nk
第三章
3.1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。 其基本思想和步骤均可归纳为:
答:第一,提出待检验的假设H0和H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 均值向量的检验:
统计量 拒绝域
均值向量的检验:
在单一变量中 当σ2已知z=当σ2未知t=
|z|>zα/2
t|>tα/2(n-1)
1n2
(S=(Xi-)2作为σ2的估计量) ∑n-1i=1
一个正态总体H0:μ=μ0
2
协差阵Σ已知T02=n(-μ0)'Σ-1(-μ0)~χ2(p)T02>χα 协差阵Σ未知
(T=(n-1-μ0)'S两个正态总体H0:μ1=μ2
2
有共同已知协差阵T0=
(n-1)-p+12n-p2
T~F(p,n-p)T>Fα
(n-1)p(n-1)p
-2
-μ0)])
n⋅m2
(-)'Σ-1(-)~χ2(p)T02>χα n+m
(n+m-2)-p+12
T~F(p,n+m-p-1)F>Fα 有共同未知协差阵F=
(n+m-2)p
⎤'-1⎤
(其中T=(n+m-2)-)⎥S-)⎥)
⎦⎦
(n-p)n
'S-1~F(p,n-p)F>Fα 协差阵不等n=mF=
p
2
协差阵不等n≠mF=(n-p)n
'S-1~F(p,n-p)F>Fα p
多个正态总体H0:μ1=μ2= =μk 单因素方差F=
(k-1)
~F(k-1,n-k)F>Fα
SSE(n-k)
多因素方差Λ=
ET
=
EA+E
~Λ(p,n-k,k-1)
协差阵的检验 检验Σ=Σ0
⎧1⎫n/2⎛e⎫
H0:Σ=Ipλ=exp⎨-trS⎬S ⎪
⎩2⎭⎝n⎭
np/2
np/2
⎧1⎫n/2⎛e⎫
H0:Σ=Σ0≠Ipλ=exp⎨-trS*⎬S* ⎪
⎩2⎭⎝n⎭
检验Σ1=Σ2= =ΣkH0:Σ1=Σ2= =Σk
统计量λk=n
np/2
∏Si
i=1
k
ni/2
S
n/2
pni/2n∏i i=1
k
第四章
4.2 试述判别分析的实质。
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,„,Rk是p维空间R p的k个子集,如果它们互不相交,且它们的和集为Rp,则称R1,R2⋯Rp为Rp的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。
4.3 简述距离判别法的基本思想和方法。
答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。
4.4 简述贝叶斯判别法的基本思想和方法。
基本思想:设k个总体G1,G2, ,Gk,其各自的分布密度函数f1(x),f2(x), ,fk(x),假设k个总体各自出现的概率分别为q1,q2, ,qk,qi≥0,
k
∑q
i=1
i
=1。设将本来属于Gi总体的样品错判到总体Gj时造成的损失为C(j|i),
i,j=1,2, ,k。
设k个总体G1,G2, ,Gk相应的p维样本空间为R=(R1,R2, ,Rk)。
在规则R下,将属于Gi的样品错判为Gj的概率为
P(j|i,R)=⎰fi(x)dxi,j=1,2, ,k
Rj
i≠j
则这种判别规则下样品错判后所造成的平均损失为
r(i|R)=∑[C(j|i)P(j|i,R)]i=1,2, ,k
j=1
k
则用规则R来进行判别所造成的总平均损失为
g(R)=∑qir(i,R)
k
=∑qi∑C(j|i)P(j|i,R)
i=1
j=1
i=1k
k
贝叶斯判别法则,就是要选择一种划分R1,R2, ,Rk,使总平均损失g(R)达到极小。 4.5 简述费希尔判别法的基本思想和方法。
答:基本思想:从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 U(X)=u1X1+u2X2+ +upXp=u'X 性判别函数式中求出U(X)值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
系数u=(u1,u2, ,up)'可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p个指标值代入线
(1)= 5 ,X (2)= 3 ,Sp= 5.82.1 假设4.7 设有两个二元总体G1和G2 ,从中分别抽取样本计算得到 X1−22.17.6Σ1=Σ2,试用距离判别法建立判别函数和判别规则。 样品X=(6,0)’应属于哪个总体?
(1)= 5 ,μ (2)= 3 , μ =1解:μ 1=X =X21−22
μ +μ 2
4
= −0.5
−1
= x−μ ′ΣWp=α’ x−μ μ1−μ2
x−μ ′= 6,0 − 4,0.5 = 2,0.5
−117.6−2.1Σ=
−2.15.8 μ1−μ2 =(2,3)′ Wp= 2,0.5
∴X∈G1即样品X属于总体G1
124.47.6−2.12
>0 =
−2.15.83第五章
5.2 试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
5.5试述K均值法与系统聚类法的异同。
答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。
不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
5.7 检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。
(1)用最短距离法进行聚类分析。 采用绝对值距离,计算样品间距离阵D(0)
G1G2G3G4G5G6
1 0
G2 1 0
G3 2 1 0
G4 5 4 3 0
G5 8 7 6 3 0
G6 10 9 8 5 2 0
由上表易知D(0)中最小元素是D12=D23=1于是将G1,G2,G3聚为一类,记为G7 计算距离阵D(1)
7G4 3 0
G5 6 3 0 G6 8 5 2 0
D(1)中最小元素是D56=2 于是将G5,G6聚为一类,记为G8
计算样本距离阵D(2)
G7G4G8
7 0
G4 3 0
G8 6 3 0
D(2)中最小元素是D47=D48=3于是将G4,G7,G8聚为一类,记为G9 因此,
(2)用重心法进行聚类分析 计算样品间平方距离阵D2(0)
G1G2G3G4G5G6
1 0
G2 1 0
G3 4 1 0
G4 25 16 9 0
G5 64 49 36 9 0
G6 100 81 64 25 4 0
易知D2(0)中最小元素是D212=D223=1于是将G1,G2,G3聚为一类,记为G7 计算距离阵D2(1)
G7G4G5G6
7 0
G4 16 0
G5 49 9 0 G6 81 25 4 0
注:计算方法D247=[6−3 1+2+1 ]2,其他以此类推。 D2(1)中最小元素是D256=4 于是将G5,G6聚为一类,记为G8 计算样本距离阵D2(2)
G7G4G8
7G4 16 0
G8 64 16 0
D2(2)中最小元素是D247=D248=16于是将G4,G7,G8聚为一类,记为G9 因此,
第六章
6.1 试述主成分分析的基本思想。
答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。
6.2 主成分分析的作用体现在何处?
答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。 3/2 6.6 已知X=(X1,X2,X3)’的协差阵为
21/45
5 31/4
11−λ
解: Σ−λE = 3/2
214
5 =0
314
−λ
5 −λ
计算得−64 λ−4 λ−8 λ−12 =0
∴λ1=12,λ2=8,λ3=4
∴D Y1 =λ1=12,D Y2 =λ2=8,D Y3 =λ3=4 λ1=12时
当,
−42 6−126 18−20−2−2 3
(Σ−λ1E)⟶ 2 −275 ⟶ 12−54 30 ⟶ 0− 1 ⟶ 0 −1 ⟶
00000065 −171210 −3410−2
0 −1 000
∴α1= 2 1, ′
同理,计算得
λ2=8时,α2=(−2, ,3)′
λ3=4时,α2=(0,− ,1)′ 易知α1,α2,α3相互正交 单位化向量得,T1=
α1 α1
=(2 ,4 ,
1
)′ 4
α2−1 3α3 1T2==( , ,)′ T3==(0 ,− ,)′
23′′′
∴Y1=T1X ,Y2=T2X ,Y3=T3X 综上所述,
第一主成分为Y1=
X21
+4X2+
1
XD Y1 43
=12
第二主成分为Y2=
−12
X1+
X4212
+4X3D Y2 =8
3
第三主成分为Y3=−
X22
+X3 D Y3 =4
6.7 设X=(X1,⋯,Xp)’的协方差阵(p×p)为 1ρ
Σ=σ2
⋮ρ
ρ⋯1⋯⋮⋱ρ⋯
ρρ
, 0
证明:λ1=σ2[1−ρ 1−ρ ]为最大特征根,其对应的主成分为Y1=σ2−λρσ2⋯ρσ2
222
证明: Σ−λE = ρσσ−λ⋯ρσ
⋮ ⋮⋱ ⋮ρσ2ρσ2⋯σ2−λ(p−1)ρσ2+σ2−λρσ2⋯ρσ2
2222 (p−1)ρσ+σ−λσ−λ⋯ρσ= ⋮ ⋮⋱ ⋮
(p−1)ρσ2+σ2−λ ρσ2⋯σ2−λ(p−1)ρσ2+σ2−λ ρσ2⋯ρσ2
22
= 0 σ(1−ρ)−λ⋯ρσ
⋮ ⋮⋱ ⋮
0 ⋯0 σ2(1−ρ)−λ
∵0
λ1=[ p−1 ρ+1] σ2,λ2= σ2(1−p)
λ1−λ2=pρ>0
∴λ1=[ p−1 ρ+1] σ2为最大特征根 当λ1=[ p−1 ρ+1] σ2时,
σ2ρ 1−p ρσ2⋯ρσ2222
ρσ σρ(1−p)⋯σρ(1−p) Σ−λ1E =
⋮ ⋮⋱ ⋮2
ρσ ρσ2⋯σ2ρ(1−p)
ρ(1−ρ)ρ⋯ ρ00 ρ(1−ρ)⋯ρ0⟶ ⟶
⋮ ⋮⋱ ⋮⋮ρρ⋯ ρ(1−ρ)0
pi=1xi。
ρ⋯ 00
−ρρ⋯00
⟶
⋮ ⋮⋱ ⋮
00⋯−ρρ1⋯
0⋯⋮⋱0⋯00 ⋮0
α1=(1,1,1,⋯)′
T1=′
所以,Y1=
pi=1xi
第七章
7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.3 简述因子模型X=AY+ε中载荷矩阵A的统计意义。 答:对于因子模型
Xi=ai1F1+ai2F2+ +aijFj+ +aimFm+εii=1,2, ,p ⎡a11⎢a21
因子载荷阵为A=⎢
⎢ ⎢⎢⎣ap1
a12
a22 ap2
a1m⎤ a2m⎥⎥=(A,A, ,A)
12m
⎥
⎥
apm⎥⎦
Xi与Fj的协方差为:
Cov(Xi,Fj)=Cov(∑aikFk+εi,Fj)
k=1m
=Cov(
∑a
k=1
m
ik
Fk,Fj)+Cov(εi,Fj)
=aij
若对Xi作标准化处理,rXi,Fj=aij,因此aij一方面表示Xi对Fj的依赖程度;另一方面也反映了变量的相对重要性。 变量共同度h=
2
i
m
Xi对公共因子Fj
∑a
j=1
2ij
i=1,2, ,p
2222
D(Xi)=ai21D(F1)+ai2D(F2)+ +aimD(Fm)+D(εi)=hi+σi说明变量Xi的方差由两部分组成:第一部分为共
同度hi2,它描述了全部公共因子对变量Xi的总方差所作的贡献,反映了公共因子对变量Xi的影响程度。第二部分为特殊因子εi对变量Xi的方差的贡献,通常称为个性方差。 而公共因子Fj对X的贡献g=
2
j
∑a
i=1
p
2ij
j=1,2, ,m
表示同一公共因子Fj对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。
7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?
答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。
最大方差旋转法是一种正交旋转的方法,其基本思路为: d11
①A→A∗→ ⋮
dp1
*
d12⋯d1m⋮⋮⋮ dp2⋯dpm
*
ijp⨯m
其中令A=AΓ=(a),
p12dij=a/hij=∑dij pi=1
*ij
p
2
A*的第j列元素平方的相对方差可定义为Vj=1∑(dij-j)2
pi=1
②V=V1+V2+ +Vm
最大方差旋转法就是选择正交矩阵Γ,使得矩阵A*所有m个列元素平方的相对方差之和达到最大。
7.5 试分析因子分析模型与线性回归模型的区别与联系。
答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系, 用函数关系式表达出来。
因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即
(i=,Xi=ai1F1+ai2F2+ +aimFm+εi,2,1, p) 该模型可用矩阵表示为:X=AF+ε而回归分析模型中多元线性回归方程模型为:y1=b0+b1x1+b2x2+⋯+bnxn+ei其中b0是常数项,b1,b2…bn是偏回归系数,ei是残差。 因子模型满足:
(1)m≤p;(2)Cov(F,ε)=0,即公共因子与特殊因子是不相关的;
0⎤⎡1
⎢1⎥
⎥=I,即各个公共因子不相关且方差为1; (3)DF=D(F)=⎢m
⎢ ⎥⎢⎥
1⎦⎣0
⎡σ120⎤
⎢⎥2
σ2⎥,即各个特殊因子不相关,方差不要求相等。 (4)Dε=D(ε)=⎢⎢⎥ ⎢⎥20σ⎢p⎥⎣⎦
而回归分析模型满足(1)正态性:随机误差(即残差)e服从均值为 0,方差为σ的正态分布;(2)等方差:
2
对于所有的自变量x,残差e的条件方差为σ,且σ为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设);(4)无自相关性:各随机误差项e互不相关。 两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。
7.6 设某客观现象可用X=(X1,X2,X3)’来描述, 在因子分析时,从约相关阵出发计算出特征值为λ1=1.754,λ2=1,λ3=0.255. 由于 λ1+λ2 /(λ1+λ2+λ3)≥85%,所以找前两个特征值所对应的公共因子即可, 又知λ1,λ2对应的正则化特征向量分别为(0.707,-0.316,0.632)’及(0,0.899,0.4470)’,要求: (1)计算因子载荷矩阵A,并建立因子模型。 (2)计算共同度h2i(i=1,2,3)。 (3)计算第一公因子对X 的“贡献”。 解:(1)根据题意,A= t1−t2
1
2
0 2
0.70700.9360
0 = −0.3160.899 = −0.4180.899 0 0.6320.44700.8370.4470∴建立因子模型为
X1 0.936F1+ε1
X2=−0.418F1+0.899F2+ε2 X3=0.837F1+0.4470F2+ε3
2
(2)h1=0.9362=0.876
22
h22=−0.418+0.899=0.983
22
h23=0.837+0.447=0.900
2
(3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为g1=λ
1
=1.754。
第九章典型相关分析
9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。 基本思想:
(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即: 若设X
(1)
(1)(1)(2)(2)
=(X1(1),X2, ,Xp)、X(2)=(X1(2),X2, ,Xq)是两组相互关联的随机变量,分别在两组变量中选
取若干有代表性的综合变量Ui、Vi,使是原变量的线性组合。
(i)(1)(i)(1)(i)(1)(i)'(1)
U=aX+aX+ +aX aX 1122PP i (i)(2)(i)(2)(i)(2)(i)'(2)V=bX+bX+ +bX bX 1122qq i
在D(a(1)'X(1))=D(b(1)'X(2))=1的条件下,使得ρ(a(1)'X(1),b(1)'X(2))达到最大。(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。