单因变量协方差分析
单因变量协方差分析
协变量分析是把回归分析和方差分析结合起来的应用方法,其目的是要把对
因变量Y值造成影响的干扰变量加以测量,并于试验中纳入此干扰变量,成为另一个自变量。其基本模型为:
yx1x2
主要成分由两部分构成,x1部分的自变量为属性因子(x1是0-1矩阵),称它为方差分析部分;x2部分的自变量为数量因子,x2为连续变量,也是所谓的干扰变量,称这部分为回归分析部分。这类在协方差分析中被考虑到回归中的自变量称作协变量;在排除协变量的影响的前提下,分析控制变量对因变量的影响,从而更加准确的多控制因素进行评价。由于引进协变量后,对模型做统计分析时需要涉及X和Y的样本协方差的计算,或许是称作协方差分析的原因之一。 协方差分析就是在有连续变量干扰的情况下,我们想办法剔除干扰因素,从而得到属性因素不同水平对观测值的真实纯净的影响。
协变量分析既是以回归分析的原理来计算协变量对因变量解释的比率,剩余的因变量变异就可以完全归因于因素水平的影响,不论协变量是否显著的解释因变量,加入协变量还是会影响方差分析的结果。
例如探讨教学方法对学习成绩的影响,其中会影响学习成绩的协变量可能有学生的智商和学习前的成绩,因此需要先行测量学生的智商和学习前成绩,并将它们视为控制变量。实验设计中,协变量常用于前后测设计,由前测所得数据作为协变量,因变量则为试验后对同一变量在此测得的后测数据,然后就可以进行协变量分析。
例1:某高血压研究中心开发了三种治疗高血压的方法,为评价三种疗法的疗效有无区别,将18名高血压患者随机分成三组,每组六人,分别接受一个疗法为期一个月的临床试验,根据所得数据,进行协方差分析。
1、 方差齐性检验和正态性检验 Analyzediscriptive statisticsexplore
检验发现,治疗前血压方差非齐性,前后都服从正态分布;
从前后相关系数来看,协变量并不显著影响解释因变量。这不符合协变量应与因变量相关的前提条件;所以只进行反差分析就好。 AnalyzeGLMunivariate
前面已经检验只治疗后方差齐性成立。
疗法的检验P值0.868>0.05,因此疗法效果一样,没有区别。
例2:研究镉作业工人暴露于烟尘的年数和肺活量的关系,按暴露年数将工人分为两组:甲组暴露>10年,乙组暴露
到暴露年数的影响。
1、 正态和方差齐性检验
正态且齐性。 2、 相关性
相关性检验显示年龄和肺活量显著负相关,这符合协方差分析的前提条件。 3、协方差检验
结果:
显著性检验看出,x对应变量的影响是显著的,g(暴露时间)对应变量的影响不显著。
从这里看出,X的系数是显著不为0的,检验认为G的系数可以认为0.此表格说明,协方差分析是带有哑变量(虚拟变量)和数量变量的回归模型;从侧面可以看出,方差分析就是只带有虚拟变量(哑变量)的回归模型。
从上面两个表格检验都可以看出:由于对工人年龄的控制,两组工人的肺活量实质上不受组别的影响,即工人的肺活量不受暴露年限的影响。