应用多元统计(朱建平)课后答案

05-23

第二章

2.1.试叙述多元联合分布和边际分布之间的关系。

解：多元联合分布讨论多个随机变量联合到一起的概率分布状况，X=(X1,X2, Xp)'的联合分布密度函数是一个p维的函数，而边际分布讨论是X=(X1,X2, Xp)'的子向量的概率分布，其概率密度函数的维数小于p。

2.2设二维随机向量(X1

解：设(X1

X2)'服从二元正态分布，写出其联合分布。

2⎛σσ12⎫1

，则其联合分布密度函数为

μ2)'，协方差矩阵为 2⎪

⎝σ21σ2⎭

X2)'的均值向量为μ=(μ1

-1/2

⎛σσ12⎫f(x)= 2⎪

⎝σ21σ2⎭

2.3已知随机向量(X1

-1

⎧⎫⎛σ12σ12⎫⎪1⎪exp⎨-(x-μ)' (x-μ)⎬。 2⎪2⎝σ21σ2⎭⎪⎪⎩⎭

X2)'的联合密度函数为

f(x1,x2)=

2[(d-c)(x1-a)+(b-a)(x2-c)-2(x1-a)(x2-c)]

(b-a)2(d-c)2

其中a≤x1≤b，c≤x2≤d。求

（1）随机变量X1和X2的边缘密度函数、均值和方差；（2）随机变量X1和X2的协方差和相关系数；（3）判断X1和X2是否相互独立。

（1）解：随机变量X1和X2的边缘密度函数、均值和方差；

fx1(x1)=⎰

2[(d-c)(x1-a)+(b-a)(x2-c)-2(x1-a)(x2-c)]

dx 22

(b-a)(d-c)

2(d-c)(x1-a)x2=

(b-a)2(d-c)2

+⎰

2[(b-a)(x2-c)-2(x1-a)(x2-c)]

dx2 22

(b-a)(d-c)

2(d-c)(x1-a)x2=

(b-a)2(d-c)22(d-c)(x1-a)x2=

(b-a)2(d-c)2

所以

+⎰

d-c

2[(b-a)t-2(x1-a)t]

(b-a)2(d-c)2

d-c

[(b-a)t2-2(x1-a)t2]+

(b-a)2(d-c)2

1 b-a

(b-a)。 b+a

由于X1服从均匀分布，则均值为，方差为

212

⎧1⎪

同理，由于X2服从均匀分布fx2(x2)=⎨d-c

⎪⎩0

（2）解：随机变量X1和X2的协方差和相关系数；

x1∈[c,d]其它

(d-c)。 d+c

，则均值为，方差为

212

cov(x1,x2)

=⎰

a+b⎫⎛d+c⎫2[(d-c)(x1-a)+(b-a)(x2-c)-2(x1-a)(x2-c)]⎛

x-x-1dx21⎪2⎪22⎰a 22(b-a)(d-c)⎝⎭⎝⎭

(c-d)(b-a)

ρ=

cov(x1,x2)

σxσx

1= 3

（3）解：判断X1和X2是否相互独立。

X1和X2由于f(x1,x2)≠fx1(x1)fx2(x2)，所以不独立。

2.4设X=(X1,X2, Xp)'服从正态分布，已知其协方差矩阵∑为对角阵，证明其分量是相互独立的随机变量。

解：因为X=(X1,X2, Xp)'的密度函数为

-1/2⎧1⎫-1

'f(x1,...,xp)=Σexp-(x-μ)Σ(x-μ)⎨⎬ ⎩2⎭⎛σ12⎫

⎪2

σ2⎪ 又由于Σ= ⎪ ⎪2⎪ σp⎭⎝

Σ=σ12σ2 σp

⎛1

σ2 1 Σ-1=

⎝

2σ2

⎫⎪⎪⎪⎪⎪ ⎪

⎪1⎪2⎪σp⎭

则f(x1,...,xp)

⎧⎛1⎪ σ2⎪ 1⎪ p

-1/2⎪1 222-1

'=Σ=σσ

σexp-(x-μ)Σ=⎨12p 2⎪

⎪ ⎪ ⎪

⎝⎩

σ2

⎫⎫

⎪⎪

⎪⎪(x-μ)⎬⎪

⎪⎪

1⎪⎪2⎪⎪σp⎭⎭

p222⎧-11(xp-μp)⎫⎪1(x1-μ1)1(x2-μ3)⎪

=σσ

σexp---...-()⎨⎬ 12p222

σ12σ22σp⎪⎪⎩2⎭

⎧(xi-μi)2⎫=⎨-⎬=f(x1)...f(xp) 2

2σi⎭i=1⎩

则其分量是相互独立。

ˆ==2.5由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为μ

∑X

i=1

ˆ=∑(X-)(X-)' Σii

i=1

⎛35650.00⎫

⎪12.33⎪ˆ== μ

17325.00⎪ 152.50⎪⎪⎝⎭

⎛201588000.0038900.0083722500.00

38900.0013.06716710.00 ˆΣ=

83722500.0016710.0036573750.00 -736800.00-35.800-199875.00⎝-736800.00⎫

⎪

-35.80⎪

-199875.00⎪

⎪

16695.10⎪⎭

0⎤⎡1

11⎢ ⎥

I=)X注：利用p⨯1=X'1n, S=X'(In-1n1'其中nn⎢⎥nn

⎢1⎥⎣0⎦

2.6 渐近无偏性、有效性和一致性；

2.7 设总体服从正态分布，X~Np(μ,Σ)，有样本X1,X2,...,Xn。由于是相互独立的正态分布随机向量之和，所以也服从正态分布。又

⎛n⎫n

E()=E ∑Xin⎪=∑E(Xi)=∑μ=μ

i=1⎝i=1⎭i=1

1nΣ⎛n⎫1n

D()=D ∑Xin⎪=2∑D(Xi)=2∑Σ=

ni=1n⎝i=1⎭ni=1

所以~Np(μ,Σ)。

ˆ2.8 方法1：Σ=(Xi-)(Xi-)' ∑n-1i=1

'=XiX'∑i-n

n-1i=1

1ˆ)='E(ΣE(∑XiX'i-n) n-1i=1

1⎡n⎤

'' =EXX-nE()()∑ii⎢⎥n-1⎣i=1⎦1⎡nΣ⎤1

=Σ-n=∑⎥n-1(n-1)Σ=Σ。 n-1⎢n⎣i=1⎦

方法2：S=

∑(X--)'

i=1

' ⎤⎡⎤=∑⎡X-μ-(-μ)X-μ-(-μ)ii⎣⎦⎣⎦

i=1n

=∑(Xi-μ)(Xi-μ)'-2∑(Xi-μ)(-μ)'+n(-μμ-μ)'

i=1n

i=1

=∑(Xi-μ)(Xi-μ)'-2n(-μ-μ)'+n(-μ-μ)'

i=1n

=∑(Xi-μ)(Xi-μ)'-n(-μ-μ)'

i=1

S1⎛n⎫E()=E ∑(Xi-μ)(Xi-μ)'-n(-μ-μ)'⎪ n-1n-1⎝i=1⎭1⎛n⎫

''=E(X-μ)(X-μ)-nE(-μ-μ)∑ii⎪=Σ。

n-1 ⎝i=1⎭

故

为Σ的无偏估计。 n-1

2.9.设X(1),X(2),...,X(n)是从多元正态分布X~Np(μ,Σ)抽出的一个简单随机样本，试求S的分布。

证明：设

⎛ Γ=

******

*⎫⎪*⎪

*⎪=(γij)为一正交矩阵，即Γ'Γ=I。 ⎪

令Ζ=(Ζ1

Ζ2 Ζn)=(X1X2 Xn)Γ'，

由于Xi(i=1,2,3,4, n)独立同正态分布,且Γ为正交矩阵

所以Z'=(Z1

Z2 Zn)独立同正态分布。且有

(Ζa)=E(∑rajΧj)

j=1n

(a=1,2,3,

,n-1)

=raj

j=1n

'rnj=0 =∑raj

i=1

Var(Ζa)=Var(∑rajΧj)

j=1

=∑rVar(Χj)=Σ∑raj=Σ

ajj=1

j=1

所以Ζ1Ζ2 Ζn-1独立同N(0,Σ)分布。

又因为S=

∑(X

i=1

-)(Xj-)'

=∑XjX'j-n

j=1

nn⎫'

XiXi⎪=ZnZ'因为n'=nn i=1i=1⎭n

又因为

∑XX'=(X

j=1

'⎫⎛X1

⎪ X'⎪

Xn) 2⎪

⎪ X'⎪⎝n⎭

=(X1

⎛X'1⎫ '⎪X2⎪ ' Xn)ΓΓ ⎪ X'⎪⎪⎝n⎭

=(Z1

⎛Z'1⎫ '⎪Z2⎪ Zn) ⎪ Z'⎪⎪⎝n⎭

所以原式

∑XX'-ZZ'=∑ZZ'-ZZ'

j=1

'+Z2Z'''=Z1Z12+...+ZnZn-ΖnΖn

故S=

∑ZZ'，由于Z,Z, ,Z

n-1j=1

n-1独立同正态分布

Np(0,Σ)，所以

S=∑ZjZ'j~Wp(n-1,∑)

j=1

n-1

2.10.设Xi(ni⨯p)是来自Np(μi,Σi)的简单随机样本，i=1,2,3, ,k，

（1）已知μ1=μ2=...=μk=μ且Σ1=Σ2=...=Σk=Σ，求μ和Σ的估计。（2）已知Σ1=Σ2=...=Σk=Σ求μ1,μ2,...,,μk和Σ的估计。

1ˆ==解：（1）μ

n1+n2+...+nk

∑∑x

a=1i=1

kna

，

ˆ=Σ

∑∑(x

a=1i=1

kna

-)(xia-)'

n1+n2+...+nk

(2) lnL(μ1, ,μk,Σ)

=ln⎡⎣(2π)Σ⎤⎦

-n1knaa

exp[-∑∑(xi-μa)'Σ-1(xia-μa)]

2a=1i=1

1n1knaa

lnL(μ,Σ)=-pnln(2π)-lnΣ-∑∑(xi-μa)'Σ-1(xia-μa)

222a=1i=1∂lnL(μ,Σ)n-11knaaa-12

'=-Σ+∑∑(Xi-μa)(Xi-μa)(Σ)=0

∂Σ22a=1i=1

∂lnL(μj,Σ)

∂μj

=∑Σ-1(Xij-μj)=0(j=1,2,...,k)

i=1

ˆj=j=解之，得μ

ˆ=∑xij，Σ

i=1

∑∑(x

j=1i=1

-j)(xij-j)'

n1+n2+...+nk

第三章

3.1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为：

答：第一，提出待检验的假设H0和H1；

第二，给出检验的统计量及其服从的分布；

第三，给定检验水平，查统计量的分布表，确定相应的临界值，从而得到否定域；

第四，根据样本观测值计算出统计量的值，看是否落入否定域中，以便对待判假设做出决策（拒绝或接受）。均值向量的检验：

统计量拒绝域

均值向量的检验：

在单一变量中当σ2已知z=当σ2未知t=

|z|>zα/2

t|>tα/2(n-1)

1n2

（S=(Xi-)2作为σ2的估计量） ∑n-1i=1

一个正态总体H0：μ=μ0

协差阵Σ已知T02=n(-μ0)'Σ-1(-μ0)~χ2(p)T02>χα 协差阵Σ未知

（T=(n-1-μ0)'S两个正态总体H0：μ1=μ2

有共同已知协差阵T0=

(n-1)-p+12n-p2

T~F(p,n-p)T>Fα

(n-1)p(n-1)p

-2

-μ0)]）

n⋅m2

(-)'Σ-1(-)~χ2(p)T02>χα n+m

(n+m-2)-p+12

T~F(p,n+m-p-1)F>Fα 有共同未知协差阵F=

(n+m-2)p

⎤'-1⎤

（其中T=(n+m-2)-)⎥S-)⎥）

⎦⎦

(n-p)n

'S-1~F(p,n-p)F>Fα 协差阵不等n=mF=

协差阵不等n≠mF=(n-p)n

'S-1~F(p,n-p)F>Fα p

多个正态总体H0：μ1=μ2= =μk 单因素方差F=

(k-1)

~F(k-1,n-k)F>Fα

SSE(n-k)

多因素方差Λ=

EA+E

~Λ(p,n-k,k-1)

协差阵的检验检验Σ=Σ0

⎧1⎫n/2⎛e⎫

H0：Σ=Ipλ=exp⎨-trS⎬S ⎪

⎩2⎭⎝n⎭

np/2

⎧1⎫n/2⎛e⎫

H0：Σ=Σ0≠Ipλ=exp⎨-trS*⎬S* ⎪

⎩2⎭⎝n⎭

检验Σ1=Σ2= =ΣkH0：Σ1=Σ2= =Σk

统计量λk=n

np/2

∏Si

i=1

ni/2

n/2

pni/2n∏i i=1

第四章

4.2 试述判别分析的实质。

答：判别分析就是希望利用已经测得的变量数据，找出一种判别函数，使得这一函数具有某种最优性质，能把属于不同类别的样本点尽可能地区别开来。设R1，R2，„，Rk是p维空间R p的k个子集，如果它们互不相交，且它们的和集为Rp，则称R1，R2⋯Rp为Rp的一个划分。判别分析问题实质上就是在某种意义上，以最优的性质对p维空间Rp构造一个“划分”，这个“划分”就构成了一个判别规则。

4.3 简述距离判别法的基本思想和方法。

答：距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离（马氏距离），将距离近的判别为一类。

4.4 简述贝叶斯判别法的基本思想和方法。

基本思想：设k个总体G1,G2, ,Gk，其各自的分布密度函数f1(x),f2(x), ,fk(x)，假设k个总体各自出现的概率分别为q1,q2, ,qk，qi≥0，

∑q

i=1

=1。设将本来属于Gi总体的样品错判到总体Gj时造成的损失为C(j|i)，

i,j=1,2, ,k。

设k个总体G1,G2, ,Gk相应的p维样本空间为R=(R1,R2, ,Rk)。

在规则R下，将属于Gi的样品错判为Gj的概率为

P(j|i,R)=⎰fi(x)dxi,j=1,2, ,k

i≠j

则这种判别规则下样品错判后所造成的平均损失为

r(i|R)=∑[C(j|i)P(j|i,R)]i=1,2, ,k

j=1

则用规则R来进行判别所造成的总平均损失为

g(R)=∑qir(i,R)

=∑qi∑C(j|i)P(j|i,R)

i=1

j=1

i=1k

贝叶斯判别法则，就是要选择一种划分R1,R2, ,Rk，使总平均损失g(R)达到极小。 4.5 简述费希尔判别法的基本思想和方法。

答：基本思想：从k个总体中抽取具有p个指标的样品观测数据，借助方差分析的思想构造一个线性判别函数 U(X)=u1X1+u2X2+ +upXp=u'X 性判别函数式中求出U(X)值，然后根据判别一定的规则，就可以判别新的样品属于哪个总体。

系数u=(u1,u2, ,up)'可使得总体之间区别最大，而使每个总体内部的离差最小。将新样品的p个指标值代入线

(1)= 5 ,X (2)= 3 ,Sp= 5.82.1 假设4.7 设有两个二元总体G1和G2 ，从中分别抽取样本计算得到 X1−22.17.6Σ1=Σ2，试用距离判别法建立判别函数和判别规则。样品X=（6，0）’应属于哪个总体？

(1)= 5 ，μ (2)= 3 ， μ =1解：μ 1=X =X21−22

μ +μ 2

= −0.5

−1

= x−μ ′ΣWp=α’ x−μ μ1−μ2

x−μ ′= 6,0 − 4,0.5 = 2,0.5

−117.6−2.1Σ=

−2.15.8 μ1−μ2 =(2,3)′ Wp= 2,0.5

∴X∈G1即样品X属于总体G1

124.47.6−2.12

>0 =

−2.15.83第五章

5.2 试述系统聚类的基本思想。

答：系统聚类的基本思想是：距离相近的样品（或变量）先聚成类，距离相远的后聚成类，过程一直进行下去，每个样品（或变量）总能聚到合适的类中。

5.5试述K均值法与系统聚类法的异同。

答：相同：K—均值法和系统聚类法一样，都是以距离的远近亲疏为标准进行聚类的。

不同：系统聚类对不同的类数产生一系列的聚类结果，而K—均值法只能产生指定类数的聚类结果。具体类数的确定，离不开实践经验的积累；有时也可以借助系统聚类法以一部分样品为对象进行聚类，其结果作为K—均值法确定类数的参考。

5.7 检测某类产品的重量，抽了六个样品，每个样品只测了一个指标，分别为1，2，3，6，9，11.试用最短距离法，重心法进行聚类分析。

（1）用最短距离法进行聚类分析。采用绝对值距离，计算样品间距离阵D（0）

G1G2G3G4G5G6

1 0

G2 1 0

G3 2 1 0

G4 5 4 3 0

G5 8 7 6 3 0

G6 10 9 8 5 2 0

由上表易知D（0）中最小元素是D12=D23=1于是将G1，G2，G3聚为一类，记为G7 计算距离阵D（1）

7G4 3 0

G5 6 3 0 G6 8 5 2 0

D（1）中最小元素是D56=2 于是将G5，G6聚为一类，记为G8

计算样本距离阵D（2）

G7G4G8

7 0

G4 3 0

G8 6 3 0

D（2）中最小元素是D47=D48=3于是将G4，G7，G8聚为一类，记为G9 因此，

（2）用重心法进行聚类分析计算样品间平方距离阵D2（0）

G1G2G3G4G5G6

1 0

G2 1 0

G3 4 1 0

G4 25 16 9 0

G5 64 49 36 9 0

G6 100 81 64 25 4 0

易知D2（0）中最小元素是D212=D223=1于是将G1，G2，G3聚为一类，记为G7 计算距离阵D2（1）

G7G4G5G6

7 0

G4 16 0

G5 49 9 0 G6 81 25 4 0

注：计算方法D247=[6−3 1+2+1 ]2,其他以此类推。 D2（1）中最小元素是D256=4 于是将G5，G6聚为一类，记为G8 计算样本距离阵D2（2）

G7G4G8

7G4 16 0

G8 64 16 0

D2（2）中最小元素是D247=D248=16于是将G4，G7，G8聚为一类，记为G9 因此，

第六章

6.1 试述主成分分析的基本思想。

答：我们处理的问题多是多指标变量问题，由于多个变量之间往往存在着一定程度的相关性，人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时，再考虑第二个线性组合。继续这个过程，直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。

6.2 主成分分析的作用体现在何处？

答：一般说来，在主成分分析适用的场合，用较少的主成分就可以得到较多的信息量。以各个主成分为分量，就得到一个更低维的随机向量；主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。 3/2 6.6 已知X=(X1,X2,X3)’的协差阵为

21/45

5 31/4

11−λ

解： Σ−λE = 3/2

214

5 =0

314

−λ

5 −λ

计算得−64 λ−4 λ−8 λ−12 =0

∴λ1=12,λ2=8,λ3=4

∴D Y1 =λ1=12,D Y2 =λ2=8,D Y3 =λ3=4 λ1=12时

当，

−42 6−126 18−20−2−2 3

（Σ−λ1E）⟶ 2 −275 ⟶ 12−54 30 ⟶ 0− 1 ⟶ 0 −1 ⟶

00000065 −171210 −3410−2

0 −1 000

∴α1= 2 1， ′

同理，计算得

λ2=8时，α2=(−2，，3)′

λ3=4时，α2=(0，− ，1)′ 易知α1，α2，α3相互正交单位化向量得，T1=

α1 α1

=(2 ,4 ,

)′ 4

α2−1 3α3 1T2==( , ,)′ T3==(0 ,− ,)′

23′′′

∴Y1=T1X ,Y2=T2X ,Y3=T3X 综上所述，

第一主成分为Y1=

X21

+4X2+

XD Y1 43

=12

第二主成分为Y2=

−12

X1+

X4212

+4X3D Y2 =8

第三主成分为Y3=−

X22

+X3 D Y3 =4

6.7 设X=(X1,⋯,Xp)’的协方差阵(p×p)为 1ρ

Σ=σ2

⋮ρ

ρ⋯1⋯⋮⋱ρ⋯

ρρ

, 0

证明：λ1=σ2[1−ρ 1−ρ ]为最大特征根，其对应的主成分为Y1=σ2−λρσ2⋯ρσ2

222

证明： Σ−λE = ρσσ−λ⋯ρσ

⋮ ⋮⋱ ⋮ρσ2ρσ2⋯σ2−λ(p−1)ρσ2+σ2−λρσ2⋯ρσ2

2222 (p−1)ρσ+σ−λσ−λ⋯ρσ= ⋮ ⋮⋱ ⋮

(p−1)ρσ2+σ2−λ ρσ2⋯σ2−λ(p−1)ρσ2+σ2−λ ρσ2⋯ρσ2

= 0 σ(1−ρ)−λ⋯ρσ

⋮ ⋮⋱ ⋮

0 ⋯0 σ2(1−ρ)−λ

∵0

λ1=[ p−1 ρ+1] σ2,λ2= σ2(1−p)

λ1−λ2=pρ>0

∴λ1=[ p−1 ρ+1] σ2为最大特征根当λ1=[ p−1 ρ+1] σ2时，

σ2ρ 1−p ρσ2⋯ρσ2222

ρσ σρ(1−p)⋯σρ(1−p) Σ−λ1E =

⋮ ⋮⋱ ⋮2

ρσ ρσ2⋯σ2ρ(1−p)

ρ(1−ρ)ρ⋯ ρ00 ρ(1−ρ)⋯ρ0⟶ ⟶

⋮ ⋮⋱ ⋮⋮ρρ⋯ ρ(1−ρ)0

pi=1xi。

ρ⋯ 00

−ρρ⋯00

⟶

⋮ ⋮⋱ ⋮

00⋯−ρρ1⋯

0⋯⋮⋱0⋯00 ⋮0

α1=(1,1,1,⋯)′

T1=′

所以，Y1=

pi=1xi

第七章

7.1 试述因子分析与主成分分析的联系与区别。

答：因子分析与主成分分析的联系是：①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的，都是从一个协方差阵出发，利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇，将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳，那么因子分析可以说是将原指标给予分解、演绎。

因子分析与主成分分析的主要区别是：主成分分析本质上是一种线性变换，将原始坐标变换到变异程度大的方向上为止，突出数据变异的方向，归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外，主成分分析不需要构造分析模型而因子分析要构造因子模型。

7.3 简述因子模型X=AY+ε中载荷矩阵A的统计意义。答：对于因子模型

Xi=ai1F1+ai2F2+ +aijFj+ +aimFm+εii=1,2, ,p ⎡a11⎢a21

因子载荷阵为A=⎢

⎢ ⎢⎢⎣ap1

a12

a22 ap2

a1m⎤ a2m⎥⎥=(A,A, ,A)

12m

⎥

apm⎥⎦

Xi与Fj的协方差为：

Cov(Xi,Fj)=Cov(∑aikFk+εi,Fj)

k=1m

=Cov(

∑a

k=1

Fk,Fj)+Cov(εi,Fj)

=aij

若对Xi作标准化处理，rXi,Fj=aij,因此aij一方面表示Xi对Fj的依赖程度；另一方面也反映了变量的相对重要性。变量共同度h=

Xi对公共因子Fj

∑a

j=1

2ij

i=1,2, ,p

2222

D(Xi)=ai21D(F1)+ai2D(F2)+ +aimD(Fm)+D(εi)=hi+σi说明变量Xi的方差由两部分组成：第一部分为共

同度hi2，它描述了全部公共因子对变量Xi的总方差所作的贡献，反映了公共因子对变量Xi的影响程度。第二部分为特殊因子εi对变量Xi的方差的贡献，通常称为个性方差。而公共因子Fj对X的贡献g=

∑a

i=1

2ij

j=1,2, ,m

表示同一公共因子Fj对各变量所提供的方差贡献之总和，它是衡量每一个公共因子相对重要性的一个尺度。

7.4 在进行因子分析时，为什么要进行因子旋转？最大方差因子旋转的基本思路是什么？

答：因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的，也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法，使每个变量仅在一个公共因子上有较大的载荷，而在其余的公共因子上的载荷比较小。

最大方差旋转法是一种正交旋转的方法，其基本思路为： d11

①A→A∗→ ⋮

dp1

d12⋯d1m⋮⋮⋮ dp2⋯dpm

ijp⨯m

其中令A=AΓ=(a),

p12dij=a/hij=∑dij pi=1

*ij

A*的第j列元素平方的相对方差可定义为Vj=1∑(dij-j)2

pi=1

②V=V1+V2+ +Vm

最大方差旋转法就是选择正交矩阵Γ，使得矩阵A*所有m个列元素平方的相对方差之和达到最大。

7.5 试分析因子分析模型与线性回归模型的区别与联系。

答：因子分析模型是一种通过显在变量测评潜在变量，通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系, 用函数关系式表达出来。

因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即

（i=,Xi=ai1F1+ai2F2+ +aimFm+εi，2,1, p）该模型可用矩阵表示为：X=AF+ε而回归分析模型中多元线性回归方程模型为：y1=b0+b1x1+b2x2+⋯+bnxn+ei其中b0是常数项，b1,b2…bn是偏回归系数，ei是残差。因子模型满足：

（1）m≤p；（2）Cov(F,ε)=0，即公共因子与特殊因子是不相关的；

0⎤⎡1

⎢1⎥

⎥=I，即各个公共因子不相关且方差为1；（3）DF=D(F)=⎢m

⎢ ⎥⎢⎥

1⎦⎣0

⎡σ120⎤

⎢⎥2

σ2⎥，即各个特殊因子不相关，方差不要求相等。（4）Dε=D(ε)=⎢⎢⎥ ⎢⎥20σ⎢p⎥⎣⎦

而回归分析模型满足（1）正态性：随机误差（即残差）e服从均值为 0，方差为σ的正态分布；（2）等方差：

２

对于所有的自变量x，残差e的条件方差为σ，且σ为常数；（3）独立性：在给定自变量x的条件下，残差e的条件期望值为0（本假设又称零均值假设）；（4）无自相关性：各随机误差项e互不相关。两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。

7.6 设某客观现象可用X=(X1,X2,X3)’来描述，在因子分析时，从约相关阵出发计算出特征值为λ1=1.754，λ2=1，λ3=0.255. 由于 λ1+λ2 /(λ1+λ2+λ3)≥85%,所以找前两个特征值所对应的公共因子即可，又知λ1，λ2对应的正则化特征向量分别为(0.707,-0.316,0.632)’及（0，0.899，0.4470）’，要求：（1）计算因子载荷矩阵A，并建立因子模型。（2）计算共同度h2i（i=1，2，3）。（3）计算第一公因子对X 的“贡献”。解：（1）根据题意，A= t1−t2

２

0 2

0.70700.9360

0 = −0.3160.899 = −0.4180.899 0 0.6320.44700.8370.4470∴建立因子模型为

X1 0.936F1+ε1

X2=−0.418F1+0.899F2+ε2 X3=0.837F1+0.4470F2+ε3

（2）h1=0.9362=0.876

h22=−0.418+0.899=0.983

h23=0.837+0.447=0.900

（3）因为是从约相关阵计算的特征值，所以公共因子对X的“贡献”为g1=λ

=1.754。

第九章典型相关分析

9.1 什么是典型相关分析？简述其基本思想。

答：典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。基本思想：

（1）在每组变量中找出变量的线性组合，使得两组的线性组合之间具有最大的相关系数。即：若设X

(1)

(1)(1)(2)(2)

=(X1(1),X2, ,Xp)、X(2)=(X1(2),X2, ,Xq)是两组相互关联的随机变量，分别在两组变量中选

取若干有代表性的综合变量Ui、Vi，使是原变量的线性组合。

(i)(1)(i)(1)(i)(1)(i)'(1)

U=aX+aX+ +aX aX 1122PP i (i)(2)(i)(2)(i)(2)(i)'(2)V=bX+bX+ +bX bX 1122qq i

在D(a(1)'X(1))=D(b(1)'X(2))=1的条件下，使得ρ(a(1)'X(1),b(1)'X(2))达到最大。（2）选取和最初挑选的这对线性组合不相关的线性组合，使其配对，并选取相关系数最大的一对。（3）如此继续下去，直到两组变量之间的相关性被提取完毕为此。

与《应用多元统计(朱建平)课后答案》相关的范文

01-20 六年级语文复习计划

指导思想：以原教学大纲、教材和新《课程标准》为依据，充分利用现有的教材，面向全体学生，切实抓好基础知识和基本技能的复习，采取切实有效的措施，使好、中、差不同的学生都得到提高。在总复习中，应该着重复习的内容：一、基础知识 1、汉语拼音汉语拼音是识字和学习普通话的重要工具。要求学生能正确地认读声母、韵母和整体认读的音节；能正确地书写大小写字母；能正确地拼读音节。要着重复习读拼音，写词语和句子 ...

03-31 八年级信息技术教学计划

八年级信息技术教学计划一、学情分析： 1、本人担任八年级信息技术课，之前除上学年学过woRD，别的相关知识没有接触，又因为本校电校上无装FLASH。所以据学生真实情况，酌情从简单实用入手，教学生电子表格知识。 2、学习目的性不明确，上课小动作多，注意力不集中，不记笔记，课后不复习。对一定要求掌握的信息技术概念及操作要领不加强巩固，对信息技术开始有些兴趣，以后兴趣越来越淡，不知任何知识要想学好都要 ...

09-17 优秀党支部书记事迹:抓班子找出路拔穷根

优秀党支部书记事迹：抓班子找出路拔穷根各位领导、同志们：你们好!我是xx市xx区xx镇xx村党支部书记朱建平，在新春来临之际，能够和省上领导、同志们坐在一起交流经验、互相学习、共谋发展，我感到十分高兴。现在我把我们近年来的工作向在座各位领导、同志们汇报如下：我村地处xx市渭北旱塬地带，距市区12公里，我们村有260户，1100人，四个村民小组，全村共20个党员(能过组织生活的只有12人， ...

03-21 三位数乘两位数的笔算教学设计及教学反思

三位数乘两位数的笔算教学设计及教学反思一、学情分析本课是冀教版小学四年级下册数学第三单元乘法的第一课时，对以后的计算和后面乘法的学习具有重要作用。学生在三年级已经掌握了两位数乘两位数的笔算方法，三位数乘两位数的笔算只是在原有基础上的进一步扩展，是对知识的迁移。二、教学目标 1、在自主尝试计算、交流等活动中，经历学习三位数乘两位数积的计算过程。 2、掌握三位数乘两位数的笔算方法，能用竖式计算三 ...

05-24 2014届高三生物复习计划

20xx届高三生物复习计划官一中王媛一、指导思想：以教材、新课程标准、考试大纲和考试说明为依据，以加强双基教学为主线，以提高学生能力为重点，全面提高学生的综合素质和应试技巧。通过高三生物总复习，处理好高中生物教材，揭示单点知识，知识结构，知识结构扩展三个层次的知识内涵及内在的逻辑联系，形成立体知识结构。把基础知识教学与能力发展触为一体，从而提高分析问题和解决问题的能力。二、复习目标: 通 ...

08-28 科研明星评选材料

科研明星评选材料大孤家中学杨宏发第一部分课题研究设计一、课题的提出 1、课题界定 ①农村初中：相对于城镇初中而言，教学条件简陋，缺乏优质师资。 ②任务型的教学模式是以具体的任务为学习动力或动机，以完成任务的过程为学习的过程，以展示任务成果的方式来体现教学的成就，这种教学模式实际上可以认为是以应用为动力，以应用为目的，以应用为核心的教学模式。 ③阅读教学模式：本课题中的“阅读教学模式”是指在 ...

09-17 2013年-2014年学年高三部分学校调研测试语文试卷分析

20xx-20xx学年高三部分学校调研测试语文试卷分析一、命题意图模拟高考：题数题型同高考，答题形式仿高考指导复习：知识技能重技巧，答题标准求规范关注现实：材料信息传时效，国计民生须知晓控制难度：平易之中设陷阱，清晰现状指方向本次考试语文命题以20XX年高考语文课标卷《考试大纲》为依据，参照20XX年高考语文新课标卷的考查内容和试卷结构，在全面考查的基础上，重点考查语文能力。整个试卷 ...

05-08 四年级语文期末考试试卷分析

四年级语文期末考试试卷分析一、学生考试情况分析本次素质检测全乡四年级共有人参加考试，总分分，平均分分，及格率为 %，优秀率为 %。四年级语文试卷，无论是学生，还是教师都会感到试题变得更灵活了，更务实了，一切都更贴近学生的生活实际了。二、试题结构特点试卷共分三大部分：基础知识阅读习作。试卷难易程度基本适中，本张试卷突出显示了以人为本，回归本色语文，绿色语文的特点。以课本为载体，辐射相应 ...

12-12 一年级下册数学.语文教学计划

一年级下册数学计划一、情况分析我班学生活泼好动，天真烂漫，大多数学生思维活跃，学习数学的兴趣较浓，有着良好的家庭教育和学习爱好。虽然他们有着强烈的好奇心和求知欲。但是，他们不懂得怎样去学习，也不会学习；有些同学学习能力差，注意力容易分散，所以教师要有层次、有耐心得进行引导，教给学生们学习的方法，培养他们养成爱好学习的习惯，使每个学生都能够顺利地完成本学期的学习任务。二、教材分析本册教材是 ...

10-07 2013年-2014年第二学期六年级数学教学工作计划

20xx-20xx第二学期六年级数学教学工作计划学习对象分析：本班学生上册应掌握的知识基本掌握较好，尤其是分数计算方面准确率较高，但在实际应用类，如应用题，还有个别学生对题目难以理解，解题困难。大部分学生学习较主动，能自觉进行课后复习、课前预习，课堂上发言较积极，但有个别学生依赖性较强，思维能力和分析能力都较差，听课时较易分神，学习成绩较不理想。同时，本班同学学习习惯大多较好，课堂听课认真，作业 ...

随机推荐

猜你喜欢

应用多元统计(朱建平)课后答案

·关于暑假三份家教经历的实践报告

·方案策划

·家长会上新教师发言稿

·必须重视!孩子玩电子产品的6大危害

·[腊梅]腊梅的养殖方法及注意事项,腊梅图片大全欣赏

·文化产业政策与韩国电视剧的发展

·文明用厕的具体要求

·成长比成绩重要2015.11

·刑事附带民事裁定书(二审维持原判决用)

·青春激扬演讲比赛主持稿

·公司行政管理制度汇总

·法律上的应当.必须.可以之概念

·2015社区防灾减灾工作总结范文

·怎么改善你的英语口语

·三风一训解释

·[亚麻课]第140课:安纳伯格庄园的亚麻沙发

·校园网中的网络安全技术研究

·血汗工厂,究竟为何

·苏州剩女多"而优" 网友称需200万成本不敢娶

·牛津译林版初一英语上册期中测试卷