用SPSS做探索性因子分析
1
2
10.12
操作步骤
3
4 第一步:载入数据并启动因子分析。 5
6 7
8 (包括9
183
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
10
1 2
3 第三步:设定因子求解办法为主成分分析法。使用相关系数矩阵,并设定主要因子的4 特征根大于1。
5
6 7
8 第四步:设计因子旋转方法为“Varimax”。然后在“Factor Analysis”窗口中按“ok”9 开始计算。
184
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
10
1 2
3
10.13
主成分分析的结果
4
5 对应于27个测度项,主成分分析法一共产生了27个因子。这是可以产生的因子个数6 的上限。“Total”列报告了每一个因子所对应的特征值。“% of Variance”表示这个特征7 值在所有特征值和中的比例。“Extraction Sums of Squared Loadings”这一列反映了特征根8 大于1的因子。在这个例子中,我们顺利地得到了7个因子。相应地,在用碎石坡法对因9 子进行目测时,我们得到的结果是一致的。请读者参看本章中的相应图例。值得一提的是,第八个因子的特征根为0.967,十分接近1。如果这个研究的理论因子个数是8个,研究者也可能考虑手工设定所要抽取的因子个数 (见第三步界面)。
185
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
10 11
1 2 3 4 5 6 7 8 9
10
SPSS也报告了每一个主成分对于一个测度项的载荷。从这个表可以看出,第一个因子解释了topicality scope, 与relevance 中的大部分信息,因为在这些测度项上这个因子的载荷很高。第二个因子则对应于background knowledge。第三个因子对应于understandability,第四个因子对应于reliability,第五个因子对应于topicality中的一部分,第六个因子对scope作了一些反向的调查,第七个因子似乎对noveltyf进行解释,但它的作用不是很明确。这就是主成分分析产生的结果的特点:它告诉我们能够得到的主要因子的个数,每一个因子所对应的信息却无法直观解释。这是因为因子之间有信息重合。
Component Matrix (a)
11 12 13 14 15 16 17 18 19 20 21 22 23 24
a 7 components extracted.
在这种情况下,我们通常对这样得到的因子进行旋转。下表报告了用Varimax旋转后的因子载荷矩阵。
187
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.26
1
2
Rotated Component Matrix (a)
3
4 5 Rotation Method: Varimax with Kaiser Normalization. 6 a Rotation converged in 6 iterations.
7
8 这个载荷矩阵明确地表示了测度项是如何与一些因子对应起来的。检查其中的每一项,我9 们会发现scope4, relevance2违反了区别效度。这就提醒我们重新审视这些测度项的措词。对于10 Scope4,测度项的措词是:The scope of this document is inappropriate for me (1-strongly disagree, 11 7-strongly agree)。而其它几个测度项的措词都是指范围过大或者过小。调查对象可能把12 inappropriate scope理解成这个文档不对应于他的信息需求,而不是它的内容的量上的不足或过13 多,结果是,这个测度项在相当程度上负载了Topicality的信息 (0.426)。relevance2的措词是:14 My opinion/view towards the current topic has been significantly changed or strengthened by this 15 document (1-strongly disagree, 7-strongly agree)。仔细观察其它的测度项,其它的测度项都表示16 “我”会不会因着这个文档采取行动,只有这个测度项测量认知上的变化。虽然认知上的变量17 符合这个因子的定义,却是很不容易让人在这种实验环境下有明确的理解。数据结果告诉我18 们,调查对象可能一开始对这个话题都没有什么看法;读了一个文档以后,他们有了一些认19 识,这对他们来讲也是全新的认识,所以这个测度项反而负载了Novelty中的信息 (0.521)。通20 过这样的“后见之明”,我们体会到在问卷设计之时没有预见到的很多陷阱。NOVEL4 (The 21 content of this document is ____ the content of other document (s) I have read。1-very similar to, 7-22
very different from) 离关键值很近,它在对应因子上的载荷刚过0.5。这是一个边缘案例。这个
188
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
1 测度项其实没有违反效度 (原文中的论述有误)。对于处于临界点的测度项,如果测度项个数太2 少,比如去掉之后会少于3,则研究者会考虑保留这个测度项。之后,这几个测度项被逐个去3 掉,在去掉每一个测度项后,我们需要重新作因子分析,以检测测度项在新的情况下的效度。4 如果效度满足,这个过程就可以停止。在本例中,前两个测度项被分两步去掉。以下的报告中5 没有包括第三个测度项是因为在其它的样本中这个测度项几次都出现效度问题 (虽然它在语义6 上没有明显的问题)。为了保证与以后要讲到的结构方程的一致性,我们在这里把它去掉。我们7 提醒读者,如果单单从一个样本来看,这个测度项是应当保留的。下表报告了剩下的测度项的8 载荷矩阵,其中也报告了特征根与一个因子中的信息量。其中因子中的信息量并不表示旋转后9 的一个主成分中的信息,而是指旋转前的信息 (基于“净化”后的测度项),所以最后三行与各10 旋转后的因子之间并没有对应关系:
11
12
Rotated Component Matrix (a)
13
14 15 Rotation Method: Varimax with Kaiser Normalization. 16 a Rotation converged in 6 iterations. 17
18 如果读者想验证旋转后的载荷矩阵与旋转前的关系,SPSS也报告了旋转所用的转换矩19 阵。对于以上结果,这个矩阵是:
20 21 22
189
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
1 2 3
4
Component Transformation Matrix
5
6 7 Rotation Method: Varimax with Kaiser Normalization. 8
9 可以验证:
10 Rotated Component Matrix = Component Matrix Component Transformation Matrix。 11
12 最后,我们如果想知道一个测度项中的信息有多少被这些主成分解释了,我们可以求这个13 载荷矩阵的积LL’。这部分被解释的信息叫作公因子方差 (communality)。在SPSS中我们可以14 得到LL’是:
15
16 Reproduced Correlations
17
know1 know2 know3 topic1 topic2 topic3 topic4 ri4 ri5 know1 0.92 0.91 0.91 -0.18 -0.23 -0.11 -0.09 0.17 0.24 know2 0.91 0.94 0.90 -0.17 -0.24 -0.13 -0.12 0.11 0.20 know3 0.91 0.90 0.91 -0.15 -0.19 -0.07 -0.09 topic1 0.17 0.22 -0.18 -0.17 -0.15 0.80 0.78 0.77 0.72 0.23 0.14 topic2 -0.23 -0.24 -0.19 0.78 0.83 0.84 0.72 topic3 -0.11 -0.13 -0.07 0.77 0.84 0.87 0.77 ….
0.17 0.02 0.25 0.09 topic4 -0.09 -0.12 -0.09
0.72 0.72 0.77 0.75 0.26
0.15
…. ri1 -0.11 -0.17 -0.12 0.26 0.23 0.27 0.28 0.59 0.55 ri3 0.17 0.12 0.17 0.28 0.28 0.39 0.39 0.64 0.59 ri4 0.17 0.11 0.17 0.23 0.17 0.25 0.26 0.82 0.80 ri5
0.24
0.20
0.22
0.14
0.02
0.09
0.15
0.80
0.85
18 Reproduced Correlations
19 Extraction Method: Principal Component Analysis.
20 a Residuals are computed between observed and reproduced correlations. There are 60 (21.0%) 21 nonredundant residuals with absolute values greater than 0.05. 22 b Reproduced communalities
23
24 这个拟合的相关系数矩阵中的对角线对应于每个测度项的公因子方差。这个矩阵正好是25 Rotated Component Matrix与其自身转置的积,读者可以自行验证。同时,SPSS也会报告每个26 测度项的公因子方差 (通过设置descriptives中的选项),其结果与这里是一致的。
27 我们现在来尝试对这个数据进行斜旋转。我们使用一种叫Oblimin的方法 (并使用默认参28 数)。斜旋转产生与前面一样的因子个数以及Component Matrix。唯一不同的是旋转以后的载荷29 矩阵。斜旋转产生两个矩阵,一个是Factor Pattern Matrix,一个是 Factor Structure Matrix。其30 中Factor Pattern Matrix表示的是因子的构造方法,即各测度项是如何通过一个类似回归的方法31 加权求和得到一个因子的值。相反,Factor Structure Matrix表示的是因子与测度项之间的载32 荷,即如何对因子进行加权求和得到测度项 (的近似值)。所以,在报告中,我们应该报告后33
者。
190
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
1 2 3 4 5
6
Pattern Matrix (a)
7
8 9 Rotation Method: Oblimin with Kaiser Normalization. a Rotation converged in 7 iterations.
从以下的Structure Matrix中,我们可以看到测度项在对应的因子上的载荷几乎都增加了。但是,有几个测度项 (比如topic4) 违反了正交时区别效度 (虽然这个规则不适用于斜旋转)。在本例中,正交旋转与斜旋转的差别不大。但这种差别在因子相关性较大时就会相当明显。
Structure Matrix
191
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
10 11 12 13 14 15 16 17
1 2 Rotation Method: Oblimin with Kaiser Normalization. 3
4 我们也可以看一眼斜旋转后因子之间的相关性 (下表)。相关系数大多在0.3以内。如果相5 关系数增加,我们的Structure Matrix就会变得更难以解释了。
6
7
Component Correlation Matrix
8
9 Rotation Method: Oblimin with Kaiser Normalization.
192
版权所有,徐云杰,博士,复旦大学管理学院。[email protected]。版本号:D 0.91,2009.11.20
DRAFT ONLY
10