无均值结构的潜变量交互效应模型的标准化估计
心理学报 2011, Vol. 43, No.10, 1219−1228
Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2011.01219
无均值结构的潜变量交互效应模型的标准化估计
吴 艳1 温忠麟2 侯杰泰3 Herbert W. Marsh4
(1广东外语外贸大学应用心理学系, 广州 510420) (2华南师范大学心理应用研究中心, 广州 510631) (3香港中文大学教育心理系, 香港) (4牛津大学教育系, 英国)
*
摘 要 潜变量交互效应建模研究近年来有两项重要进展, 一是提出了潜变量交互效应模型的标准化估计及其计算公式; 二是发现无均值结构模型可以取代传统的有均值结构模型, 建模大为简化。但标准化估计是在传统的有均值结构模型中建立的, 在简化的模型中同样适用吗?本文在无均值结构模型的框架内, 给出了潜变量交互效应模型的标准化形式、计算公式和建模步骤, 并通过模拟研究比较了极大似然和广义最小二乘两种估计方法、配对乘积指标和全部乘积指标两种指标类型, 结果表明, 在计算交互效应的标准化估计时, 应当使用配对乘积指标建模, 并且首选极大似然估计。 关键词 潜变量; 交互效应; 结构方程; 乘积指标; 估计方法 分类号 B841.2
在心理、行为、管理和市场等研究领域, 所涉及的变量往往是潜变量(latent variable), 如成就动机、负性情感、工作满意度等都是潜变量。如何分析潜变量的交互效应(interaction effect), 是研究方法领域的一个重要课题, 近年来有了长足的发展, 其中比较重要的进展有两个。一是提出了潜变量交互效应(包括调节效应)模型的适当“标准化”估计1 (appropriate standardized estimation)及其计算公式(温忠麟, 侯杰泰, & Marsh, 2008), 并且证明了“标准化”估计是尺度不变的(scale invariant), 即“标准化”估计不会因测量单位的改变而变化(Wen, Marsh, & Hau, 2010)。二是发现无均值结构的模型可以取代传统的有均值结构的模型, 建模大为简化, 且理论上不会改变主效应和交互效应(Lin, Wen, Marsh, & Lin, 2010; 吴艳, 温忠麟, 林冠群, 2009), 模拟研究结果支持了理论预期。
前述的潜变量交互效应模型的“标准化”估计是在传统的有均值结构的模型中建立的, 在简化的收稿日期: 2010-10-08
* 国家自然科学基金项目(30870784)资助。 通讯作者: 温忠麟, E-mail: [email protected]
1
模型中同样适用吗?本文在无均值结构模型的框架内, 给出潜变量交互效应模型的“标准化”形式、计算公式和建模步骤, 并且用模拟的方法研究了下面两个问题:(1)计算潜变量交互效应模型的“标准化”估计时, 结构方程建模(structural equation modeling, SEM)软件中默认的极大似然(maximum likelihood, ML)方法是否还应当是首选的估计方法?(2)计算潜变量交互效应模型的“标准化”估计时, 配对乘积指标策略(Marsh, Wen, & Hau, 2004)是否还是比较好的策略?其中, 第一个问题被Wen等人(2010)作为一个有待解决的问题提了出来, 而第二个问题则还未见有人讨论过。显然, 这两个都是在实际应用中会碰到的并且需要解决的问题。
1 无均值结构的潜变量交互效应模
型的标准化估计
1.1 文献回顾与问题的提出
设要分析ξ1和ξ2对η 的交互效应。传统建模方
为了区别于由统计软件得到的标准化估计(standardized estimation), 用“标准化”估计来表示交互效应的标准化估计。但在不致引起混淆的场合, 可以简单地称为标准化估计。
1220 心 理 学 报 43卷
法是使用下面的结构方程 比较方程(1)及其“标准化”形式(3), 我们可以
η=γ1ξ1+γ2ξ2+γ3ξ1ξ2+ζ (1) 推测方程(2)相应的 “标准化”形式为
来分析潜变量交互效应(例如, Algina & Moulder, ′′′′ξ2′+γ3′′[ξ1′ξ2′−E(ξ1′ξ2′)]+ζ∗ (5) η∗=γ1ξ1′+γ2 2001; Jaccard & Wan, 1995; Jöreskog & Yang, 1996; Kenny & Judd, 1984; Little, Bovaird, & Widaman, 2006; Marsh et al., 2004; Marsh, Wen, & Hau, 2006; 温忠麟等, 2008), 其中系数γ1,γ2代表主效应, γ3代表交互效应。使用方程(1)分析潜变量交互效应时, 传统上都认为相应的结构方程模型(包括结构方程和y-指标测量方程)需要有均值结构(Marsh et al., 2004)。吴艳等人(2009)分析了均值结构的根源在于交互结构项ξ1ξ2的均值不是零(LISREL程序中需要有KA), 并导致y-指标测量方程需要常数项(LISREL程序中需要有TY)。他们改用ξ1ξ2−
下面要证明推测的正确性。
1.2 无均值结构的潜变量交互效应结构方程的
“标准化”形式
我们要从方程(2)出发, 推导出无均值结构的“标准化”形式。为了指定潜变量的测量原点(original), 通常都(默认)设定ξ1和ξ2的均值为零(例如, Algina & Moulder, 2001; Jaccard & Wan, 1995; Jöreskog & Yang 1996; Kenny & Judd, 1984; Marsh et al., 2004; Moulder & Algina, 2002; Wall & Amemiya, 2001), 即E(ξ1)=0, E(ξ2)=0。注意到残
差项ζ的均值为零, 所以由方程(2)可得E(η)=0。
E(ξ1ξ2)作为交互结构项, 建立下面的结构方程
η=γ1ξ1+γ2ξ2+γ3[ξ1ξ2−E(ξ1ξ2)]+ζ (2) 设η′表示η的标准化变量, 将方程(2)变形如下
η−E(η)γ1ξ1+γ2ξ2+γ3[ξ1ξ2−E(ξ1ξ2)]+ζ因为ξ1ξ2−E(ξ1ξ2)的均值等于零, 彻底消除了产生η′= =sd(η)sd(η)
均值结构的根源, 因而对应的结构方程模型(包括结
γ[ξξ−E(ξ1ξ2)]γξγξζ构方程和测量方程)都不再需要均值结构。Lin等人 =11+22+312+
sd(η)sd(η)sd(η)sd(η)
(2010)采用指标的双重中心化(double-mean-centering)
sd(ξ1)ξ1sd(ξ2)ξ2
策略建模, 也导出了与(2)相同的结构方程。 =γ1+γ2
sd(η)sd(ξ1)sd(η)sd(ξ2)
温忠麟等人(2008, 也见Wen et al., 2010)创立
sd(ξ1ξ2)ξ1ξ2−E(ξ1ξ2)ζ的潜变量交互效应模型“标准化”估计是在需要均 (6) +γ3+sd(η)sd(ξ1ξ2)sd(η)
值结构的方程(1)的基础上得到的, 方程(1)相应的
其中sd (x)表示x的标准差, 如sd(η)表示η的标准“标准化”形式为
(6)中最后一个等号不过是将一些项的分子分母差。′′ξ2′+γ3′′ξ1′ξ2′+ζ∗ (3) η∗=γ1′′ξ1′+γ2
同时乘上相同的值。注意到ξ1, ξ2的均值为零, (6)′分别是ξ1和ξ2的标准化变量(均值M=0, 其中ξ1′和ξ2
可写成下面的标准化形式 ′是它们的乘积, 表示ξ1′和ξ2′的标准差SD=1); ξ1′ξ2
′ξ1′+γ2′ξ2′+γ3′(ξ1ξ2)′+ζ* (7) η′=γ1 ′′,γ2′′ 和γ3′′的估计就作为方程交互作用项, 系数γ1
′分别是ξ1和ξ2的标准化变量, (ξ1ξ2)′是其中ξ1′和ξ2(1)的“标准化”估计。这样的“标准化”估计与方程(1)
′, γ2′和γ3′是标准化系数, 它ξ1ξ2的标准化变量, γ1的原始估计和方程(1)的标准化估计(即潜变量为标
们可以从SEM软件(如LISREL)的标准化解得到。准化变量时对应的估计)的关系如下(按SEM软件
比较方程(6)和(7)可知 LISREL记号)
sd(ξ1)sd(ξ2)sd(ξ1ξ2)′′′γγγγ, γγ, (8) === ′′′′′′′′′ γ1=γ1, γ2=
γ2, γ3=γ112233
sd()sd()sd()ηηη
′, γ2′和γ3′是方程(1)中主效应和交互效应其中, γ1′, γ2′和γ3′估计不是交互效应模型但这样得到的γ1
′的交合适的标准化估计, 因为(ξ1ξ2)′不是ξ1′和ξ2
的标准化估计, φ11,φ22和φ33分别是ξ1, ξ2和ξ1ξ2的方差的原始估计, 都可由SEM软件直接得到。
现在, 有了无需均值结构的方程(2), 就产生了下面两个问题:
(i)方程(2)相应的“标准化”形式是什么? (ii)由方程(2)出发, 可以得到参数的原始估计和标准化估计。这时, 计算“标准化”估计的公式还是和(4)一模一样吗?
互作用项(温忠麟等, 2008)。
为了推出与方程(3)类似但又无需均值结构的“标准化”方程, 将方程(2)重新变形如下
η−E(η)γ1ξ1+γ2ξ2+γ3[ξ1ξ2−E(ξ1ξ2)]+ζ
=
sd(η)sd(η)sd(ξ1)ξ1sd(ξ2)ξ2sd(ξ1)sd(ξ2)=γ1+γ2+γ3
sd(η)sd(ξ1)sd(η)sd(ξ2)sd(η)η′=
10期 吴 艳 等: 无均值结构的潜变量交互效应模型的标准化估计 1221
⎧⎡ξξ2ξ2⎤⎫ζ⎪ξ1⎪
(9) −E⎢1+⎨⎬⎥
sd(ξ)sd(ξ)sd(ξ)sd(ξ)sd(η)⎪⎪1212⎦⎭⎣⎩
2 估计方法对潜变量交互效应标准
化估计的影响
通常的结构方程分析, 估计参数时都使用软件默认的ML方法。ML方法是在正态假设下推导出来的, 即假设模型中所有指标都是正态分布(严格当正态假设不满足时, 如果说来是多元正态分布)。
ML估计的精确度不会显著恶化, 就可以说ML估计对分布有稳健性(robust)。
上式可以写成下面的形式
′′ξ2′+γ3′′[ξ1′ξ2′−E(ξ1′ξ′)]+ζ* (10) η′=γ1′′ξ1′+γ2
′分别是ξ1和ξ2的标准化变量, ξ1′ξ2′是其中ξ1′和ξ2
′的乘积项, ξ1′ξ2′−E(ξ1′ξ′)代表的是“标准化”ξ1′和ξ2
模型中的测量指标是否正态的呢?这是所有
sd(ξ1)sd(ξ2)′′=γ3γ3 (11) 结构方程模型使用ML估计的时候都面临的一个问sd(η)
题, 而不是潜变量交互效应模型特有的。但潜变量
方程(10)正是我们需要的与方程(2)相应的“标
交互效应模型还面临新的问题, 即使ξ1和ξ2正态
′′,γ2′′和γ3′′是方程(2)的合适的标准化准化”形式, γ1
的, 乘积项ξ1ξ2也不是正态的(Jöreskog & Yang,
′′,γ2′′,γ3′′和γ1′, 系数。比较公式(8)和(11)可得到 γ1
所以, 任何一个潜变量交互效应模型都不满1996)。
′, γ3′的关系 γ2
足ML的假设。所幸的是, 许多研究都发现, ML估sd(ξ1)sd(ξ2)
′′=γ1′, γ2′′=γ2′, γ3′′=γ3′γ1 (12)
计有稳健性(例见Boomsma, 1983; Hau & Marsh, sd(ξ1ξ2)
2004)。 按LISREL记号, (12)和(4)完全一致。
这样, 我们一举解决了上节提出的两个问题。这就说明, 在使用无需均值结构的模型后, 还是可以用温忠麟等人(2008)推出的公式(4)计算主效应和交互效应的“标准化”估计, 而且有关“标准化”估计的尺度不变性质仍然成立(见Wen et al., 2010):交互效应的“标即无论使用什么尺度单位, 主效应、准化”估计和显著性检验结果是相同的。
面对模型的非正态问题, 从文献上看主要有两种策略去应对。一种策略是试图使用无需分布假设的估计方法, 如一般加权最小二乘 (weighted least squares, WLS)、广义最小二乘 (generalized least squares, GLS)。不过, 研究发现, 除非样本容量很大(如超过2000), 否则WLS估计不比ML估计表现好, 甚至更差(Jaccard & Wan, 1995; Wall & Amemiya, 2001; Marsh et al., 2004)。虽然GLS估计有时不如WLS估计, 但至少不像WLS估计那样需要复杂的计算。这就容易理解, Wen等人(2010)在用模拟数据展示潜变量交互效应的“标准化”估计的尺度不变性的时候, 只是报告了ML估计和GLS估计的结果。
另一种应对非正态问题的策略是对ML估计的标准误进行校正(Satorra & Bentler, 1988), 这是因为在非正态情形, ML估计的标准误和模型拟合的卡方值都可能是错误的, 需要校正(Yang-Wallentin & Jöreskog 2001)。Marsh等人(2004)推出无约束方法的时候, 也考察了ML估计的标准误经过Satorra-Bentler校正的效果。SEM软件LISREL 8.5以上版本可以得到这种校正后的结果。然而, 变量交互效应的“标准化”估计是根据模型的原始估计和标准化估计使用公式计算出来的(Wen et al., 2010; 温忠麟等, 2008), 而Satorra-Bentler校正只是针对原始解, 所以Satorra-Bentler校正不适用于目前讨论的“标准化”估计。
的交互结构。比较方程(9)和(10)可知
sd(ξ1)sd(ξ2)
′′=γ2γ1′′=γ1, γ2,
sd(η)sd(η)
1.3 有关“标准化”形式的讨论
对于方程(1), 注意到E(η)=γ3E(ξ1ξ2), 所以不难验证, 从方程(1)出发, 照样可以推出方程(10)。就是说, 无论从有均值结构的方程(1)出发, 还是从无均值结构的方程(2)出发, 都可以推出相同的“标准化”形式(10), 从这个角度说, 方程(10)是真正意义上的“标准化”形式。因为采用指标的双重中心化策略建模(Lin et al., 2010)导出的结构方程和本文研究的方程(2)完全相同, 所以双重中心化对应的“标准化”估计与本文的计算方法完全一样。
在通常的回归分析中, 标准化回归方程的所有自变量和因变量都是标准化变量, 而温忠麟等人(2008)推出的方程(3), 左手边η∗的均值不是零, 因而不是η的标准化变量。只要使用传统的有均值结构的模型, 这个“缺陷”是不可避免的。但本文推导
′都的方程(10), 内生变量η′以及外生变量ξ1′和ξ2
是标准化变量, 从这个角度说, 方程(10)也是真正意义上的“标准化”形式。
1222 心 理 学 报 43卷
这样, 对于潜变量交互效应模型, 值得比较的是用ML方法和GLS方法计算得到“标准化”估计, 看看ML是否仍然是首选的估计方法, 将在第4节中采用模拟的方法进行。需要说明的是, 使用ML方法和GLS方法不能直接求出潜变量交互效应模型的“标准化”估计, 而是先求出模型的原始估计和标准化估计, 然后使用公式(12)计算。
虽然模拟研究中不同的乘积指标类型(详见下一节)对应的测量方程不同, 因而对应的模型拟合函数也不一样, 但写成矩阵形式后都一样。ML方法对应的拟合函数是
FML=log|Σ(θ)|−log|S|+tr(SΣ−1(θ))−(p+q)
个指标(如x1x4和x1x5, 都含x1)而高相关, 产生多更重要的是, 当指重共线性(multicollinearity)现象。
标没有重复使用时, 误差的方差-协方差矩阵是对角矩阵, 建模比较简单。配对乘积指标显然满足这两条建议。而单一乘积指标不满足第一条建议, 全Batista-Foguet, 部交叉乘积指标不满足第二条建议。
Coenders和Saris (2004) 从不同的角度出发也得到了相同的结果, 即建议使用配对乘积指标。
其中p是y-指标个数, q是x-指标(包括乘积指标)
个数, S是全部指标组成的(p+q)×1向量(y′,x′)′的样本协方差矩阵, Σ(θ)是由模型推出的协方差矩阵, log|A|表示矩阵A的行列式的对数, tr(A)表示矩阵A的迹。GLS方法对应的拟合函数是
1
FGLS=tr[(I−Σ(θ)S−1)2]
2
其中I是单位矩阵(详见侯杰泰, 温忠麟, 成子娟, 2004)。
使得拟合函数达到最小值的解就是参数估计, 当使用SEM软件(本文使用LISREL)时, 只要设定模型并指定估计方法, 软件就会按指定的估计方法进行计算, 我们无需考虑算法问题。
3 产生乘积指标的策略对潜变量交
互效应标准化估计的影响
3.1 产生乘积指标的策略
Marsh等人(2004)系统比较了产生乘积指标的三种策略:全部交叉乘积指标、配对乘积指标和单一乘积指标。以ξ1和ξ2各有3个指标为例, ξ1的指标是x1,x2,x3, ξ2的指标是x4,x5,x6, 则全部交叉乘积指标为x1x4,x1x5x1x6,x2x4,x2x5x2x6,x3x4, x3x5x3x6; 配对乘积指标如x1x4,x2x5,x3x6(共有6种可能的组合); 单一乘积指标如x1x4(共有9种可能的组合)。他们还比较了不同组合的配对乘积指标, 不同组合的单一乘积指标。在综合考虑了模型简洁性、模型拟合指数、估计偏差和精确度之后, 发现配对乘积指标较好。根据这一结果, 他们对产生乘积指标给出如下建议:(1)使用所有指标(即每个指标都在乘积指标中出现), 以充分利用信息; (2) 不要重复使用指标(即一个指标不要在乘积指标中出现多于一次),以免两个乘积指标因含有相同的一
3.2 指标配对策略
配对乘积指标可以通过不同的组合方式产生, 例如, x1x4,x2x5,x3x6是一组配对乘积指标, x1x5,x2x4,x3x6也是一组配对乘积指标。Marsh等人(2004)的研究结果是, 有高负荷的指标应当配对相乘, 即“大配大, 小配小”。以ξ1和ξ2各有3个指标为例, 首先, 分别以ξ1和ξ2为因子, 以各自的3个指标做单因子的验证性因子分析, 然后将完全标准化估计(completely standardized estimation, 即潜变量和指标都是标准化变量时对应的估计)的负荷由高到低排序, 并按“大配大, 小配小”将指标配对相
Batista-Foguet和Coenders (2007) 肯定乘。 Saris,
了Marsh等人(2004)的研究结果, 建议有最高信度的指标应当配对相乘。在完全标准化解中, 负荷最大的指标其信度也最高。Coenders, Batista-Foguet和Saris (2008)的新近工作使用的就是配对策略, 并且将信度最高的指标相乘。
问题是, 对于潜变量交互效应模型的“标准化”估计, 产生乘积指标的策略和配对策略仍然有效吗?第4节中采用模拟的方法进行研究, 所用的模型是无均值结构模型。
4 模拟研究
4.1 模拟设计
设计的模型和参数综合参考了Marsh等人(2004)的模拟研究2和4。他们在模拟设计时, 对模型及其参数的真值、因素的水平都有一个较好的说明, 解释设计的依据。他们的模拟研究2比较了产生乘积指标的不同策略, 模拟研究4则比较了正态和非正态条件。而本研究要同时考虑产生乘积指标的策略和变量的正态性, 所以综合参考他们的两个模拟研究设计。下面先介绍本模拟研究的模型, 然后说明设计的因素及其水平。
设潜变量η, ξ1和ξ2各有3个指标, 分别是y1,y2,y3; x1,x2,x3; 和x4,x5,x6。y1,y2,y3在η上的标准化负荷都是 0.7, x1,x2,x3在ξ1的标准化负荷
10期 吴 艳 等: 无均值结构的潜变量交互效应模型的标准化估计 1223
分别是 0.9, 0.7 和0.5, x4,x5,x6 在ξ2上的负荷也分别是0.9, 0.7 和0.5。总体的结构方程为
η=0.4ξ1+0.4ξ2+0.2ξ1ξ2+ζ 其中ξ1和ξ2是标准化变量, 因而总体的两个“标准化”主效应都是0.4, “标准化”交互效应是0.2。ξ1和
et al., 2004), 而且建模比较简单。在目前的无均值结构模型中, 只要全部交叉乘积指标没有优势, 就是配对乘积指标胜出。下面将从4个方面进行比较:适当解比例、拟合指数、估计偏差和精确度。
4.2.1 适当解 在每种处理中, 有250个重复样本, 得到250个估计结果, 其中有些结果是不收敛的。我们首先要排除那些不收敛的结果。在收敛的结果中, 有些是不适当的(improper)。例如, 相关系数估计值的绝对值大于1, 方差(或标准误)的估计值是负值, 这些都是不适当的。我们只能使用那些收敛到适当解的结果。所以适当解的百分比的高低是衡量一种处理好坏的一个指标 (Marsh et al., 2004)。
从表1可以看出, 当N = 500和1000时, 几乎当N = 200时, 适当解的都可以100%得到适当解。
比例接近或超过9成, 无论是正态还是偏态, 无论哪种乘积指标类型, 都是ML方法的适当解比例较高; 使用ML方法时, 配对乘积指标的适当解比例有时略低于全部乘积指标, 但相差不大(3%左右), 使用GLS没有这个问题。后面的结果都是基于适当解计算的。
4.2.2 拟合指数 对于无约束方法, 要估计的参数个数与乘积指标的个数有关:加入全部9个乘积指标要估计58个(正态)或者60个(偏态)参数, 自由度为113(正态)或者111(偏态); 加入3个配对乘积指标要估计28个(正态)或者30个(偏态)参数, 自由度为50(正态)或者48(偏态)。总的来说, 不同处理得到的模型拟合指数(包括χ2/df, RMSEA, NNFI和CFI, 参见温忠麟, 侯杰泰和Marsh, 2004)差异不大, 并且都拟合得很好(见表1)。当N = 200是, 无论是正态还是偏态, 无论哪种乘积指标类型, 都是ML方法的拟合略好一些(RMSEA略小, CFI略大)。两种乘积指标类型在各种条件下的拟合指数几乎没有差别。
4.2.3 主效应的估计偏差 使用相对偏差衡量估偏差=(估计值的均值−计偏差大小(Lin et al., 2010):
真值) /真值。对于两个主效应项, 设计的“标准化”真值都是0.4, 从表2 可以看出, 其“标准化”估计
′′和γ2′′)相对来说是无偏的。 (γ1
ξ2的相关系数为0.3。设计的因素和水平如下:
ξ1和ξ2的分布:(1)正态:N (0, 1), (2)偏态:由χ2(6)分布标准化得到。(被试间因素)
样本容量 (N): 200, 500, 1000 。(被试间因素) 乘积指标类型:(1)配对乘积(3个乘积指标), 全部交叉乘积(9个乘积指标)。(被试内因素)
估计方法: (1)ML方法, (2)GLS方法。(被试内因素)
这是一个2×3×2×2设计, 共有24种处理(即水对于被试间因素, 不同水平对应的模拟数平组合)。
据是不同的。对于被试内因素, 不同水平对应的模拟数据相同。前两个因素其实是数据的条件, 后两个因素才是本文关心的对象—— 乘积指标类型和参数估计方法。这样的设计可以了解在不同数据条件下, 使用什么乘积指标类型来建模、使用什么估计方法比较好。
对每种被试间处理, 用 PRELIS 2.5 产生250 个重复样本。模拟产生的指标方差都是1, 负荷按就前述设计, 测量误差的分布与产生ξ1,ξ2的相同。是说, 除了一个常数外, 误差的分布分别是正态分布和χ2(6)分布。这样模拟的数据再作下面的线性变换, 变换成不同的测量单位(参见Marsh et al., 2004):