非线性模型中多个交互项的估计
非线性模型中多个交互项的估计
张 爽*
摘 要:非线性模型中交互项的偏效应并不等同于交互项的系数或由简单回归得到的偏效应, 而应该由被解释变量对交互的解释变量求交叉偏导得到。本文将对交互项的估计扩展到包含多个交互项的非线性模型中, 提出了在包含多个交互项的非线性模型中估计交互项的正确方法, 并编写了相应的程序。
关键词:非线性模型 多个交互项 偏效应
2006 第3期
52一、引 言在计量经济学模型里, 当一个解释变量对被解释变量的偏效应取决于另一个解释变量的大小时, 经济学家通常在模型中加入这两个解释变量的交互项来进行分析。无论是连续变量还是离散变量都有可能在回归模型中产生交互作用。当两个解释变量存在交互作用时, 如果不在模型中引入交互项, 将会产生遗漏变量偏误而无法得到
对解释变量的无偏估计。近年来, 交互项在实证研究中的运用越来越广泛, 除了能够用它来判断两个解释变量之间的交互作用之外, 它还经常被作为政策评估的工具, 在使用混合截面或面板数据的模型中进行两阶段差分法(Differ ence In Differ ence) 。
在线性模型里, 我们能非常直接地得到交互项以及交互的解释变量的偏效应。交互项的偏效应等于简单回归得到的交互项的系数, 交互项的显著性也直接由系数的t 检验来判断。然而, 在非线性模型里, 我们却不能直接得到交互项以及交互的解释变量的偏效应。与线性模型不同的是, 非线性模型里交互项的偏效应和显著性都有可能与简单回归得到的结果不同。因此, 尽管交互项的运用非常广泛, 但是在非线性模型里正确地估计交互项却并不那么容易。A i 和Norton (2003) 提出, Jstor 列出的在1980到2000年间发表在13种期刊上的在非线性模型中使用交互项的文章, 几乎都没有正确地估计出交互项的偏效应。A i 和Norton(2003) 编写了命令/inteff 0①来对非线性模型里的交互项进行正确的估计。
但是, 命令/inteff 0只能在包含一个交互项的非线性模型里对交互项进行估计, 却不能用于包含一个以上交互项的非线性模型。M arinescu(2005) 在包含了两个交互项的pr obit 模型里使用/inteff 0①来估计交互项的偏效应和标准差, 得到的结果是有偏误的。
因此, 本文将对交互项的估计从只包含一个交互项的非线性模型扩展到包含一个以上交互项的非线性模型, 并编写了在包含多个交互项的非线性模型里正确估计交互项的程序。
*
①张爽, 复旦大学经济学系和复旦大学就业与社会保障研究中心, E -mail:042015197@fudan. edu. cn 。A T A 8. 0
二、交互项的估计
(一) 线性模型
首先, 我们来看线性模型中交互项的估计, 以包含一个交互项的线性模型为例:y =A +B (1) 1x 1+B 2x 2+B 12x 1+B i other +L
在(1) 式里, other 表示其他没有交互作用的解释变量。交互项的偏效应为被解释变量y 对交互的两个解释变量x 1和x 2求交叉偏导:
2=B (2) 1215x 2
由此可见, 交互项的偏效应就等于交互项本身的系数B 12, 交互项的显著性由系数B 12的t 检验来判断。因此, 交互项的偏效应和显著性可以直接由简单回归得到的结果报告。而交互的解释变量x 1的偏效应为:
=B (3) 1+B 12x 21
x 1的偏效应取决于x 2的大小, 通常在x 2的均值处求解。求x 2的偏效应也同理。
(二) 包含一个交互项的非线性模型
然后, 我们在非线性模型里对交互项进行估计, 以包含一个交互项的pr obit 模型为例:
p(y =1) =5(A +B ) (4) 1x 1+B 2x 2+B 12x 1#x 2+B i other +L
我们通常用命令/dprobit 0或在pr obit 0后用/mfx compute 0来报告解释变量的偏效应, 而由上述命令报告的交互项x 1#x 2的偏效应为:
=5' #B (5) 121#x 2)
Ai 和Nor ton(2003) 指出, 大多数已有文献都错误地直接用这个简单回归的结果来报告交互项的偏效应。但是, 这个结果并不等同于交互项真正的偏效应。因为命令/dprobit 0或/mfx compute 0将x 1#x 2看作一个单独的解释变量进行求导, 而无法辨别出交互项是两个解释变量的乘积形式。对交互项正确的估计方法是被解释变量y 对交互的两个解释变量x 1和x 2求交叉偏导:
2=5' #(B (6) 2+B 12x 1) #(B 1+B 12x 2) +5' #B 1212
由(6) 可知, 非线性模型里交互项的偏效应并不等于由命令/dprobit 0或/mfx com -pute 0报告的结果, 而且交互项的显著性也不能由上述命令报告的z 检验来判断。Ai 和Nor ton(2003) 编写了命令/inteff 0, 该命令在pr obit 或logit 模型只包含一个交互项时, 能够按照(6) 式正确地估计出交互项的偏效应, 并报告交互项的标准差。命令/inteff 0用在/probit 0或/logit 0之后, 写法如下:
Inteff y x 1 x 2 x 1#x 2 other (7) 该命令解决了在包含一个交互项的线性模型里对交互项进行估计的问题, 但是并不能用于包含一个以上交互项的非线性模型。因为, 正如(7) 所示, 命令/inteff 0在估计交互项时只考虑前四个变量, 而不考虑other 代表的其他解释变量。然而, 当非2006 第3期 53
偏误。
(三) 包含一个以上交互项的非线性模型
我们以包含两个交互项的probit 模型为例:
p(y =1) =5(A +B ) 1x 1+B 2x 2+B 3x 3+B 13x 1#x 3+B 23x 2#x 3+B i other +L
在(8) 式里, 交互项x 1#x 2的偏效应为:(8)
2006 第3期
542=5' #(B (9) 3+B 13x 1+B 23x 2) #(B 1+B 13x 3) +5' #B 1315x 3由(9) 式可知, 交互项x 1#x 2的偏效应取决于x 1、x 2和x 3的取值。当我们用命令/inteff 0估计x 1#x 3时, 该命令写为:Inteff y x 1 x 3 x 1#x 3 other (10) 这里在估计x 1#x 3的偏效应时, 只考虑了x 1和x 3的取值, 而x 2被包含在用other 表示的其他解释变量里被忽略掉了。因此, 用命令/inteff 0估计出来的交互项x 1#x 3的偏效应和标准差是不准确的。我们用一个更一般的命令/predictnl 0来解决/inteff 0无法解决的问题。Ai 和Norton(2003) 提到的唯一一篇正确地估计了交互项的文章DeL eir e(2000) , 也正是使
用命令/predictnl 0编写的程序得到了正确估计。不过, DeLeire(2000) 的模型里的交互项是由虚拟变量构成, 他编写的程序(DeLeire, 2004) 只能用于在两阶段差分(Differ -ence In Difference) 时虚拟变量的交互项的估计, 而并不能用于估计由连续变量构成的交互项。因此, 我们按照(9) 式编写了估计交互项的程序(见附录) , 该程序可以用于估计由连续变量构成的交互项。与命令/inteff 0相比, 0predictnl 0可以用在任何包含多个交互项②的非线性模型里, 得到交互项以及交互的解释变量的正确估计。
三、结 论
通过以上的分析, 我们可以确认:在非线性模型中, 交互项的偏效应和标准差不等同于直接由简单回归得到的结果。要正确估计交互项的偏效应, 必须用被解释变量对交互的解释变量求交叉偏导, 而且交互项的显著性也应该根据求交叉偏导得到的结果来进行检验。当非线性模型中出现一个以上的交互项时, 使用命令/inteff 0来估计交互项将会出现偏误, 而应该用命令/predictnl 0来得到交互项的正确估计。
在包含多个交互项的非线性模型里估计交互项的实证研究范例请参见我们的另一篇文章/社会资本的作用会被市场化减弱还是加强? ) ) ) 来自中国农村贫困的实证研究0。
参考文献:
A i, C. R. and E. C. N ort on, 2003, /Interact ion T erms in L ogit and Probit M odels, 0Eco -
nomics Let ter , 80(1) , pp. 123-129.
DeL eire, T. , 2000, /T he Wage and Employment Effects of t he Americans wit h Disabilit ies
A ct, 0J ournal of H uman Resource , 35(4) , pp. 693-715.
Deleire, T. , 2004, /A N ot e on Calculating Dif ference In Difference U sing Probit M odels ver -St
M arinescu, I. , 2005, /A re Judges Sensitive to Economic Condit ions? -Evidence from UK
Employment T ribunals, 0London School of Economics and Political Science, H arvard U -niversit y, Working Paper.
张爽, 陆铭, 章元, 2006, /社会资本的作用会被市场化减弱还是加强? ) ) ) 来自中国农村贫困
的实证研究, 0复旦大学工作论文。
附录:
在包含一个以上交互项的非线性模型里估计交互项的程序) ) ) 以(8) 式的模型为例(为简便起见, 我们在这里将其他解释变量ot her 认为是一个变量) :
1, 估计交互项x 1#x 3的偏效应和标准差的程序如下(其他交互项也同理)
probit y x1x2x3x1x2x1x3ot her, robust
qui sum x1if e(sample)
local meanx1=r(mean)
qui sum x2if e(sample)
local meanx2=r(mean)
qui sum x3if e(sample)
local meanx3=r(mean)
qui sum other if e(sample)
local meanother=r(mean)
local xb _b[x1]*`meanx1' +_b[x2]*`meanx2' +_b[x3]*`meanx3' +_b[x1x2]*`meanx1'*`meanx2' +_b[x1x3]*`meanx1' *`meanx3' +_b[other]*`meanot her' +_b[_cons]
predictnl dydx1x 3=normden(`x b' ) *(-(`xb' ) ) *(_b[x3]+_b[x1x3]*`meanx1'+_b[x2x3]*`meanx2') *(_b[x1]+_b[x1x3]*`meanx3') +normden(`xb') *(_b[x1x3]) in 1, se (sedydx1x3)
list dydx1x3sedydx1x3in 1
2, 估计交互的解释变量x 1的偏效应和标准差(其他交互的解释变量也同理)
在(8) 式的模型里:
程序如下:
probit y x1x2x3x1x2x1x3ot her, robust
qui sum x1if e(sample)
local meanx1=r(mean)
qui sum x2if e(sample)
local meanx2=r(mean)
qui sum x3if e(sample)
local meanx3=r(mean)
qui sum other if e(sample)
local meanother=r(mean)
local xb _b[x1]*`meanx1' +_b[x2]*`meanx2' +_b[x3]*`meanx3' +_b[x1x2]*`meanx1'*`meanx2' +_b[x1x3]*`meanx1' *`meanx3' +_b[other]*`meanot her' +_b[_cons]
predictnl dydx1=normden(`xb' ) *(_b[x1]+_b[x1x 3]*`meanx3' ) in 1, se(sedydx1) =5' #(B 1+B 13x 3) 12006 第3期 55